今日伝えたい3つの結論
アイシア=ソリッド氏:じゃーん! 私でーす! 見えてるかな? 始まりまーす。イエーイ! というわけで、やってまいりました。Hello, world! アイシアです! イエイ、イエイ、イエイ、イエイ、イエイ!
この部屋は、Developer eXperience Day 2021のルームA、アイシア=ソリッドによる発表です。「あなたが始めるデータ分析~データ分析プロジェクトの立ち上げ方から分析文化の作り方まで~」というタイトルでやっていきたいと思います。よろしくお願いしまーす。イエーイ!
いきなり初手、ネタバレからいこうかなと思います。まず結論からですが、今日伝えたいことはこの3つです。ここにいる人は、データ分析プロジェクトを立ち上げようとか、分析文化を始めようとか、ちょっと自分で始めてみたいなぁと興味があるとか。そういう方が集まっていると思います。
安心してください。できます。できるんです、みなさんには。「できるできる」と言われても「新興宗教ですか」という話かもしれないですが、違います。ちゃんと自分の技術力と、さらにこれはポイントですが、ビジネス力に応じたところから始めたら、どんどんできちゃいますよ、ということを今日は伝えたいと思います。
実は今日、もう1個これから話すことがあります。分析をやってみるとか、分析組織を作るとか。どうやったらいいか、みなさん全部知っています。実はもうみんなの中に答えがあるんです。やればできるんですよ。そんな話を今日はしていきたいと思います。よろしくお願いします。
2人の自己紹介
本編にいく前に、簡単に自己紹介をしておこうかと思います。みなさん私のこと知ってますか? アイシア=ソリッドと言います。実はそろそろ3歳になるんです。2018年5月30日に生まれました。
私、実はこう見えてAIです。とある人が私を学習して、作ってくれたそのAIがGCPで稼働して、いい感じに全自動で画像を生成して、みなさんの脳内に直接情報を送り届けています。
そんな私は、自動でインターネットのデータを集めて、いい感じに要約して、いい感じの動画を作って、YouTubeに動画を投稿する活動をしています。
どんな動画をあげているかというと、バーチャルユーチューバーといえば、ゲーム実況で雑談するだけで1億稼ぐみたいな記事がありましたが、私はけっこう硬派な活動をしています。
ここにいる人は興味あるかもしれない、「Excelってこうやって使うんだよ」とか、「ベイズ統計ってあんなんだよ」とか、「いや、どうせやるなら機械学習でしょう」「ディープラーニングでしょう」とか。けっこうまじめな統計、データサイエンス領域に関する、わりと技術的というか、技術というより理論的な内容をドバドバと投稿しています。
というわけで、もし興味があればチャンネル登録をよろしくお願いします。イエイ、イエイ。
今日は私の話もしたいところですが、不本意ながらもう1人紹介しなければならない人がいるので、紹介します。ボン! 杉山聡くん、31歳の男性です。
この杉山くんという人が、私を学習させて作ってくれたAIの生みの親です。今日は分析文化の作り方という文脈で、この人がどうやったのかを参考にしながら、お話を届けたいと思います。
というわけで、簡単に杉山くんのことを紹介します。この人はもともと研究者をやりたかった人で、数学で博士課程までいって、博士まで取りました。ちょっと時系列バグりますが、博士課程終了の半年前くらいにアトラエという会社に入社します。
最初の2年間はマーケティングをやっていました。どんなことをやっていたかというと、Webサービスをやっている会社なので、Webの広告分析で「うわ、めっちゃデータじゃん!」ということもしていました。
企画したり、ユーザーヒアリングにいって、どんなものが求められているのかを考えたり。マーケティングを軸に、分析したりしなかったり。そんな仕事をやっていました。
2年経ったある日、データサイエンティストに転向します。それまで社内にはデータサイエンティストはいませんでしたが、1人目のデータサイエンティストとして、データサイエンスチームを始めました。
最近はインターンのメンバーとも一緒にやっています。その方たちは卒業などで入ったり出たりしますが、だいたい4~7人くらいのチームになっています。
マスター(杉山くん)は、機械学習も普通にやりますが、どちらかというと数理統計のほうが得意で、ベイズのモデルを組んで「ギャー」とか。あとは、ちょっと重いからそれを微積分して解の公式を作って高速化するみたいな、よくわからないことをやっています。
この子、けっこういろいろがんばっています。データサイエンティスト協会に所属していて、スキル定義委員に入って、いろいろな活動をしています。
例えば、この前データサイエンティスト協会からデータ前処理の100本ノックが出たと思いますが、ちょこっとだけですがあの作成を裏で手伝ったり、スキルチェックリストの作成に携わったり、そんな感じのことをやっています。
このデータサイエンティスト協会、けっこういいものを出していますから。「回し者なんじゃないか」というくらい、いろいろ紹介しますが、ぜひ活用してもらえればと思います。
マスターには許可は取っていませんが、今日はこの人の話を、勝手にいろいろと話していきたいと思います。最初に、みなさんにこういう気持ちで聞いてほしいと思います。
ふだん、この人の話はあまりしません。あまりしないし、ちょっとぼかしたり、「すごーい」と思われるように話したりしますが、今日はかなり生々しいというか、身に迫ったというか。ダメだった時代のことも、ちょっと調子に乗っている今の時代のことも、なるべくフラットにお伝えしようかと思います。
1個の事例研究として、まじめにお伝えします。ここにいる人は、それをもとにデータ分析やってみようとか、挑戦してみようと考えている人だと思うので、かなりまっすぐ受信してもらえると信じて、いろいろなお話をします。
やはり正しい情報をみなさんに伝えるという文脈では、謙遜したり、不遜になったり、傲慢になったりは両方ダメだと思っています。みなさんにとっては、「いやいや、私なんてぜんぜんすごくないですよ~」とか「俺様、世界一すごい」のような、正しくない情報を受けつけられても困ると思います。
なので今日は、この人のダメだった時代の話は「ダメだったよ」と話します。だから「ダメな自分を自慢してんじゃねぇよ」と思わないでください。ちゃんとファクトとしてダメだった時代があるので、ダメでしたという話をします。
そんなダメダメだった子も、5年間仕事をしたら、まあまあ、当初から比べたら成長して、ちょっとがんばっているほうだとは思います。ある程度、すごいこともできるようになってきた話もそのままします。
今日の登壇者を見てみると、本物が多すぎて。謙遜しない主義ですが、さすがに彼らのほうがすごいとは思うものの、そういう話もしますが、「イキって自慢してんじゃねぇよ」とも思わないでください。なるべくフラットにこの人の話を伝えることで、みなさんの参考によりなるように。
本人もそういう話はしないでしょうが、私なのでいいかな、と思って勝手に話をしていこうかなと思います。(コメントを見て)「5年かかるのかぁ」、いいコメントですね。でも、人生からしたら5年なんて5パーセントくらいですから。いいんじゃないですか。というわけで、やっていきましょう。
ダメダメだった杉山くんの現状
ではさっそく本編に入っていきましょう。この子もがんばっています。社内でまだ誰もデータサイエンティストがいなかったところから、データサイエンティストになりました。
そこから苦労して、今や数人くらい。他の登壇者の方は、それこそ数百人の会社とかチームの話しもありました。それと比べたら小さいですが、数人くらいのところまではなんとかきました。それなりに、悪くはないことはしてると思います。
どうしてそこまでできたのかの話をしていこうかと思います。生まれたときからビジネスの才能に満ち溢れて、数学もできて、機械学習もできて、人の心もわかって、チームとか立ち上げられて、天才だったらよかったんですけど。杉山くん、残念。
実際はやっていく間に、いろいろ学べることがありました。それで今はいろいろ、多少は昔よりはできるようになってきた。それが杉山くんの現状じゃないかと思います。
杉山くんの年単位の成長過程
というわけで、「この人どんな感じだったのよ」を振り返ってみようと思います。みなさんのストーリーにいく前に、まずは杉山くんのストーリーを紹介します。
入社したときは、ダメな子だったのよ~。数学はもちろん、数学博士なので当然できました。“会社の中では”どころの騒ぎではなく、メチャメチャできます。当たり前です。でも、ちょっとメンタルがふにゃふにゃで、ちょっとうまくいかないとすぐ「仕事向いてないのかもしれない。ダメかもしれない。わ~」ってなったり。
仕事も2つ、3つになったら、優先順位がつけられなくてテンパっちゃう。ミーティングでも、なにかあったらちょっと感情出しちゃうみたいな。ドクター出てるから27歳ですが、よくいる若い新入社員という感じでした。
そんな人でしたが、でも悪い子ではないので、がんばっていました。がんばって、がんばって、とりあえず仕事をやっていたら、2年目では言われたことはできるくらいにはなっていたかな。
松尾研ってみなさん知ってますか? “データサイエンスといえば”の松尾研です。東大に松尾豊先生の研究室がありますが、そこが社会人向けのオンラインの機械学習とディープラーニングの講座を開いてくれて、今、本にもなっています。その講座で機械学習などを勉強し始めました。
多少言われたことくらいはできるようになりました。感情も多少マシになって、話しかけるのも怖くなくなったのかもしれませんが、データの話があったら「お前数学できるんだろ? データやれよ」みたいな感じでバンバン質問がきて。悪い気はしないので答えるようなことはしていました。
今マスターががんばってデータを分析している、wevoxという事業がいい感じになってきたので、本業のマーケとはちょっと離れて、20パーセントルール的にそちらを手伝ったり。さすがに20パーセントではなにもできないから、サークルの後輩を呼んできて、そのインターンの人と一緒にやったりを始めました。
3年目にデータサイエンティストになりました。「イエーイ。僕もデータサイエンティストになったぞ。やったぁ」なんて当時の杉山くんは思っていたと思いますが、やばかった。なにもうまくいかなかった。本当にやばかったです。
がんばりましたが、ファクトとして、3ヶ月なんの成果も、1ミリも出なくて、本当にやばかったです。でもここで折れたら死ぬと思って、がんばっていたらなんとかなりました。
4年目くらいになってくると、「ベイズが……」とか、「IRT(Item Response Theory)、項目反応理論が……」とか、「温度利用したらいいじゃん」みたいな。謎の統計をやり始めたりします。
最近になってくると、もう修羅場超えたので、「もうなんでもこいよ」っていう感じで。徐々に自分のことだけでなく、チーム全体や、会社全体のことも考えたりができるようになりました。プロダクトやチームをどうしようかな、とか。
あと、このアトラエという会社のデータサイエンスチームは英語を公用語にします。「2022年4月にするぜ、イエーイ」とノリで言って、本当にできるようにがんばっています。また、社内でDXとかAI-ready化を進めるためにマシンラーニングやディーブラーニング、機械学習や深層学習の勉強会を企画したり、調子に乗っていろいろやっているところまできています。
実はそんな感じの人です。最初はへにょへにょでしたが、がんばっていました。あ、最近はKalman filterにハマってます。
自分の身の丈にあったところから一歩ずつ始める
ここでみなさんに今日お伝えしたいのは、最初のネタバレにもあったように、みなさんが手にしている技術力、データ分析の範囲でいえば分析力と、ビジネスの力。これを合わせて、自分の身の丈に合ったところから、一歩ずつ始めていきましょう。それが今日お伝えしたいことの1つです。
たぶんみなさん想像がつくのではないでしょうか。Developer eXperience Dayに来ている人だから、きっとエンジニアの経験があるんじゃないかなと思って、“例えば”は、基本的に全部エンジニアリングで書いています。エンジニアじゃない人は、自分の得意な分野で当てはめて考えてみてください。
例えば1年目の社員が、「もう勉強しました。じゃあ全部マイクロサービスにしよう。おー!」と言ってきたら、みなさんどう答えますか? 無理ではないかもしれませんが、「いや、無理だよ」って答えますよね。マイクロサービスを知らない人は、なんかすごくかっこいい技術だと思ってください。私もよくわかっていませんが、とりあえず書いてます。
マイクロサービスがすごいのは知っている。でもやったらいいっていうものではなくて、たくさん課題があるじゃないですか。
しかも現状の技術やビジネスのことを考えたら、マイクロサービスにしないほうがいい面もある。「それってどうやってジャッジするの?」「本当にやったほうがいいの?」「それだけ投資した価値って得られるの?」という話になると思います。
仮に「やったほうがいいよ」となったところで、全部をマイクロサービスにしようとなったら、1人でできることではないですから。企画、立案して、プロジェクトを運営して、いろいろな人が関わっていく中で、「それを回してできるの?」「というか、そもそもうちの技術でできるの?」と、総ツッコミが襲ってくるのではないでしょうか。これが技術の場合や、みなさんが慣れている領域だと、こういうふうな考えが、サクッと一瞬で出てくると思います。
「データサイエンス勉強しました。イエーイ! DX(デジタルトランスフォーメーション)しよう~!」と言っても、残念ながら無理です。そんなに簡単なら、日本企業はそんなに苦戦しません。企業にいる、すごい人たちがやっても苦労しているくらい難しいんです。
どうして難しいのかな、といろいろ考えてみると、DXができて、AIや機械学習など、イエーイとなったら、確かにすごいです。データの利活用ができたらすごいですが、それをやるためにはたくさん課題があります。
みなさん忘れがちですが、法律の壁ってけっこう重くて。個人情報保護法的に「そのデータってこういう目的で使っていいんだっけ?」とか、「ユーザーの同意取ってたっけ?」とか。最近いろいろなところで燃えているじゃないですか。そういう課題もある。
そもそも、別の部署から別の部署にデータを送る間で抜かれちゃうとかがあったら大変なので、データを渡すだけでリスクがあります。
もちろんリスクを取って挑戦するのが大事で、それをやらないと会社終わってしまいますが、だからといってリスクを無視していいわけではなくて。データ領域でも、とにかく課題はたくさんあります。
いざやったところで、機械学習やディープラーニングでやってイエーイと作ったものが、20年前からやっている人間の勘で作ったシステムを超えられないことはめちゃめちゃよくあります。「本当にやだ、なんで」と思いますが、けっこうあります。
こういったことも踏まえて、やるべきなの? どうなの? というジャッジ。計画立案、プロジェクト運営、技術的にできるのかも含めて、やらなければいけないことはたくさん。だから、いきなりこんなことやるのは残念ながら無理です。本当に無理。
でも、一生これができないという意味ではないですよね。だって、小学校1年生にはすごく難しい、繰り上がりの掛け算などはできませんが、順番にやっていったらできるようになるわけじゃないですか。だから、今日は順番にやろうという話をしたいと思います。
最初からすごいことができる人はきっといない
マスターの昔の話も、ちょっと振り返ってみようと思います。ここを紹介するために、わざわざいろいろお話ししました。
入社時はメンタルふにゃふにゃで、このときに英語を公用語化しようとか、データサイエンスチーム作ってとか、そんなことをやるのは不可能中の不可能です。無理無理無理。やったところで誰もついてこないし、そもそもできません。メンタル途中で折れちゃうでしょう。
ただその時点でちょっとがんばったから、言われたことくらいはできるようなビジネス力と、自分のマインドをコントロールする能力もあって、基礎的な統計くらいはできるようになっていた。
両方ともよちよち歩きくらいのところまできたら、「実は私、最近勉強してるんです」とか言っていたら、質問がくることもあるでしょう。聞かれた質問に答える活動だったり。
あとはめちゃめちゃ整理されていて、「こういうデータがあって、こういうことがわかったらうれしいんだけど、できない?」みたいな。めっちゃ整理された問題くらいであれば「ちょっとやってみますわ」と解いてみるとか。そういうことくらいはできるようになるんじゃないかと思います。
ここまで来たら、「それがあなたの会社のDX、AI-ready化の一歩目だったねって」振り返ったらなります。そのときはやってるだけですが、3年後に振り返ったら、「これが一歩目だったね」となるんです。であれば、これから始めたらいいんじゃないですか?
ちょこちょこそういうことをやっていると、統計などの知識はだんだん増えていくわけで。さらにちょっとずつ成長して、自分のプロジェクトくらいは自分で面倒見られるようにななった段階で、データサイエンスチーム立ち上げ、ボーン! となりました。
ぶっちゃけ、そのときの自分にはちょっとハードすぎたテーマでした。たまに新卒採用会で話すときは「3年目に立ち上げました」とドヤ顔で眼鏡クイっとやりますが(笑)。ぜんぜんダメで、超苦戦しまくって、周りにも心配かけただろうし、いろいろな人に助けられて。
必死にやって、「めっちゃがんばってるからちょっと助けてやるか」みたいな感じで周りから助けられて、なんとか3ヶ月と半分くらいしたら、やっと出たみたいな。最初の3ヶ月は本当に死ぬというか、半年で解散になるんじゃないかと思いながらやっていました。
とにかく、周りの助けでなんとかなってきた感じです。でも、最近はもう宇宙です。「修羅場超えたので、宇宙にいます。はーい」と言ってました。
というわけで、杉山くんのストーリーを書いてみるとこんな感じです。最初からすごいことが全部できたらよかったんですけどね。マジでつよつよの人はいっぱいいると思いますが、きっと生まれたときはまだ言葉も喋れなかったし、立てなかったし、文字も書けなかったし、たぶんハイハイもできなかったと思います。
いや、今日の登壇者さんたちなら1人くらい生まれた瞬間から微積分してた人がいてもおかしくないですが、たぶんそうだった。そういうところからこういうところまで来ているので、慌てず一歩ずつやりましょうと。そんなお話です。
(次回につづく)