データ解析部門で活躍する若手社員

越島健介氏(以下、越島):入社2年目の越島と申します。早稲田の大学院で機械学習を学んで、「変化点検知」という、時系列データの中の異常検知をメインのトピックとして研究していました。

いろいろなところでインターンをしながら「どこに行こうかな」と考えていて、結局リクルートジョブズに入りました。

今はデータマネジメントグループというところにいて、人数は9人ぐらいです。基本的に、それぞれのプロジェクトを持って進めていくような組織になります。

僕が1年目にやったのは、Indeedにリクルートジョブズが広告を出稿していて、そのクリック課金の広告の入札の最適化をする仕組みを一から作ったり。

あと『タウンワーク』アプリの検索エンジンのソートのアルゴリズムのAPIを作ったりとか。そういったものを仕事としてやっています。以上です。

西村直樹氏(以下、西村):リクルートライフスタイルの西村です。僕は新卒入社1年目です。学生の頃は、オペレーションズ・リサーチや数理最適化などを行っている研究室にいました。リクルートライフスタイルと一緒に共同研究をする機会があり、そんな経緯もあって、今リクルートにいます。研究以外ではデータ解析のコンペティションに参加したりもしてました。

仕事では、ユーザーのロイヤリティ向上や離反予防のためのポイントインセンティブ付与効率化だとか、メールでの商品推薦の施策においてカスタマーにとって親和性の高いものを出しつつ、クライアントにとってもなるべく不平等にならないような配信をするためのアルゴリズムなどを作ったりしています。よろしくお願いします。

データサイエンティストの日常

司会者:よろしくお願いします。では、みなさんからいただいた質問を抜粋して、2人から答えていただくかたちで進めたいと思います。

1つ目の質問、「日々どのように仕事を進めていますか?」ということで、具体的にどんなことをしているかスケジュールも含めてお答えいただければと思います。

越島:僕は基本的には、半年から1年ぐらいかかりそうなプロジェクトをやります。「この目標を達成しよう」みたいな感じで進めるんですけど。

そもそも「何をやるの?」というところは、けっこう自分で探してくることが多いです。「こんなデータあるよ」みたいな話を聞きにいったり、逆に社内の他部署の方から相談してもらったり、新技術の動向を追ったりしながら、事業に大きく貢献できそうな案件を模索していきます。

それでやろうとなったら、最初は設計から入って、それが事業にフィットするかを話し合って決めていく。モノによるんですけど、だいたい1ヶ月から2ヶ月ほどかかります。

そのあと実装のフェーズに入るんですけど、データ解析は前処理がすごく大変なんです。その辺もいろいろ工夫してやりつつ作っていきます。

最初は試験的に導入して、サーチだったりA/Bテストで少しだけ入れてみて、効果が良いのか悪いのか。悪かったらもう1回戻って、なにが悪いのか検証しながら実験します。

最終的に「これでいいね」となったら、運用も含めて100パーセントにしても大丈夫なように作って持っていって、最後に運用を他の方に託して次のプロジェクトへ、みたいな感じです。

司会者:西村さんどうですか?

西村: 僕は1年目に4案件ぐらい施策に関わったんですけど、ある程度事業で「こういう問題がある」というような、課題が顕在化した状態のものにとりかかるということが多かったです。

それに対して、事業としてマストな条件はなにか、あるといい条件はなにか、とか課題を分解しながら適切なアプローチを検討して、妥当そうと事業側に確認できたら、モデルの実装・運用して結果をみる、といったような流れで進めてましたね。

スケジュールとしては、「ここまでで動くようにする」というような決まった期日があって、その過程でわからないことがあったら、その都度メールしたり席に行ってみたりして確認したりする、ということ多かったです。例えば、データベースの中身に関してわからないことがあったら、データを作った人のところに行って、「ここどうなってるんですかね?」みたいな。

打ち合わせや会議の時間は事業の人と比べると比較的少ないと思っていて、1日のうちだいたい8割くらいの時間をコードを書くとかの作業時間に使ってます。

上司やメンバーとの作業について

参加者:上司の方や共同するメンバーの方はどんな感じですか?

越島:ゴールを決めたら上司から細かい指示はまったくないんですよ。だから、なにをどう工夫して、どうやるかは自分で考えるしかない。

ただ、事業の観点で気をつけなきゃいけないポイントや押さえなきゃいけないポイントについてはしっかりアドバイスをくれるので、そういうポイントは相談しつつやっていきます。

同僚でいうと、先ほどお話しした『タウンワーク』のサーチ系のエンジンのAPIを作るのは6人のチームで進めていて、その中でも「インフラチーム」と、「分析・ロジックチーム」みたいに分かれています。毎日30分ぐらいみんなで集まって進捗報告をしたり、相談事があればそこで話します。

司会者:西村さんはどうですか?

西村:リクルートライフスタイルのデータサイエンスチームは、各サービスのプロデューサーが属しているプロダクトマネジメントユニットという組織の直下にいるんですけど、そこのプロデューサーの人たちと施策における分析活用のアイデア出しをしたりすることがあります。

あとはCRMユニットという、顧客とのコミュニケーション施策を担当する部署があって、そういう部署の方たちとも、分析を活用したよりよいコミュニケーションの方法などについて議論だとか協業だとかすることが多いです。

ライフスタイルではデータサイエンスチームの複数のメンバーで1つの施策を、ということは少なくて、1施策分析者ひとりが事業の人と協業しながら、という感じで進めることが多い気がします。

司会者:組織によって、仕事の進め方がけっこう変わってきますよね。

西村:違う気がしますね。

司会者:リクルート自体「データ解析コース」ができたのが2、3年前ぐらいですよね。

越島:僕のときはなかったです。

西村:僕のときからです。ちょうど1年前ですね。

入社後の修羅場体験

司会者:こういう方々が組織に入ってやっているというかたちになります。けっこう修羅場体験あったんじゃないですか?(笑)

越島:まあ、ありましたね(笑)。さっきの入札の仕組みでいうと、アルバイトの媒体なので、広告に使える予算が1日これぐらいまでと決まっていて。

予算を定められているなかで、1回僕が試験的にやったときに失敗してしまって……。社内のいろんな人に迷惑をかけてしまい、すごい怒られまくって。上司に慰められて泣くという。会社で泣くって想像してなかったです(笑)。

司会者:どのタイミング? 1年目?

越島:入って半年ぐらいかな。

司会者:想像がつかないです(笑)。西村さんはなにかありました?

西村:さすがに泣くほどのことはなかったですけど(笑)。

けっこう大変だったのは、新しい施策が始まるとなったときに、普通予測モデルを作るとなると、ある程度データがあって、それを学習してモデルを作る、というやり方をすると思うんですけど、新しい施策だとデータもないし、それを打ったらどうなるかもわからないというところに、「精度のいい予測モデル作ってくださいよ」というようなことがあって。

学生の頃だったら諦めてたと思うんですけど、いろいろ駆けずり回ったりしながら、とりあえず動くものをつくって、データが溜まってきてからまたモデルを改良して、とか泥臭い作業をしながら、なんとか最後には形になりました。

データ解析はリクルートの事業にどう影響するか

司会者:では次のテーマに進みます。「分析結果はどのように事業に反映されていくんでしょうか?」という質問がありました。

もしかしたら、リクルートは営業が強いというイメージがあるかと思うんですけど。そういう会社に、データ解析がどのようなかたちで寄与されてくのか気になっている方も多いと思うので、越島さんからお願いします。

越島:僕がやってきたプロジェクトだと、本当に仕組みまで作って、本番に入れて、それが運用されて動くというかたちで、反映していきます。

さっき自分は「半年〜1年スパンでやってる」と言いましたけど。うちのグループには、また違う形で案件を担当してる人もいます。1週間から2週間単位の細かい分析をいっぱいして、短いサイクルでPDCAを回して、自分たちの事業に反映する仕事をしている人もいます。

例えば、事業側の人から「こんな数字見たい」とか「こういう仮説があるんだけど、データ的に検証できないかな?」とか、そういう相談を実際に分析して、「こうでしたよ」みたいな会話をしながら企画を練っていくみたいな感じです。だいたいその2パターンですね。

司会者:西村さんはどうですか?

西村:反映されやすいと思いますね。

例えば新規の事業や、ある程度成熟してきた事業があるなかで、新規の事業だと「ユーザー数を獲得したい時期だ」とか、成熟した事業だと「売上を最大化したい時期だ」とか追っている目標があって、「そのために分析を使って1番効くことはなんだろう?」ということを考えた時に、大きな見込みがあるところから対処していく、というのがチームの方針になってます。

そういう根本にある目標のために動いていくので、けっこうわかりやすく分析の結果が事業に反映されていると思いますよ。

司会者:モノによると思うんですけど、インパクトってけっこう大きいですよね。イメージだとどのくらい?

越島:金額換算すると年数億円以上のコスト削減効果とか、そういうレベルを目指します。最初の「これやろう」という狙いを見定めるところで失敗すると、効果の低い案件になってしまう危険性があるので。最初のセンスや勘所ってすごい大事なんですね。それを検証した上でやって、うまくいけば、やっぱりインパクトはでかいです。

司会者:ありがとうございます。

入社を決めたポイント

司会者:3つ目の質問、「入社を決めたポイントはなんでしたか?」。お二人が就活のときにどういう意思決定をしたのか。そこをお聞きしたいと思います。

越島:僕は大学3年生のときとM1のときに2回就活してるんですけど。大学3年のときは大手ITベンチャー企業で半年くらい働いていて。

そのときに「けっこう若いうちから広く活き活きやらしてもらえる会社がいいな」という価値観が形成されて、いろいろあって、大学院に行って勉強しました。

そのあとに就活したときも、「若手のうちからいろいろやらせてもらえる」というのと、「データに携わる」という2軸で探しました。リクルートは持ってるデータの幅もやってる事業もおもしろかった。

僕が入ったときは、データ解析担当者の採用をやり始めたかどうかぐらいのタイミングで、「今飛び込んだらおもしろいかな?」みたいな感じで決めました。

司会者:西村さんはどうですか?

西村:研究をやったりする中でやりがいとか面白さを感じてたので、まず「データ解析を活用できるところ」という基準で。今日来てくださってる学生さんもそんな方が多そうですね。

それとリクルートライフスタイルと共同研究をしていたので、どんな人が、どういう考え方で仕事をしていて、どういうふうに課題を解決しているかみたいな、雰囲気がある程度わかったので、「そういう働き方ができたらいいな」と。

あとは越島さんも言ってましたけど、扱える種類のデータが日常消費領域からライフイベント領域まで幅広くあるところがいいと思って。そこが最後の決め手だったと思います。

リクルートの環境を活かした技術の学び方

司会者:最後の質問なんですが、「入社後に技術をどのように学んでますか?」という。学生時代と比べたら仕事も忙しくて、時間が限られていると思うんですけど。お二人がどんなふうに勉強しているのか教えてもらいたいと思います。

越島:普通に仕事の中でやっていることと、自分でやっていることの2つがあります。学生の研究ってわりと、データセットはデータセットであって、それに対していろいろ手法を考えて実験して、というところだと思うのですが、仕事において自分のアウトプットを事業に組み込むものとして考えたときに、仕組みとしてそれをどう作るかみたいなことは、機械学習の知識じゃない部分で、エンジニアリングだったり、インフラだったり、その辺の知識が必要になってきます。

そういうのは「どうやったらこれが実現できるかな?」って調べながらやっていて、自ずと身につきました。そこは相当仕事の中で身についたことだなと思っております。

一方で、新しい機械学習手法とかは、移動中や週末に読んだりしつつ、あとは会社から学会に行かせてもらったりして、そういったところで情報を仕入れています。

司会者:西村さんはどうですか?

西村:そうですね、日々の業務で必要なことはその場その場でずっと学んでいかないといけないと思うんですけど。

インプットの機会としては、社内に外部から講師の方を呼んできて、分析に必要なソフトウェアの講習を1日使ってやることがあったりしました。

それと同じデータ解析職採用で入った同期から学ぶことも多くて。同期と一緒にCourseraのマシンラーニングの動画を観ながらランチを食べたりとか、平日夜に社外の人も交えて勉強会をやったりとか、自分一人だとできないことも、そういう機会から新しいことが学べたりしますね。

あとは、学生の頃の大学の先生や先輩と今も研究を続けていて、リクルート社内のデータを使って研究をさせてもらったりもしています。良いことができるのであれば、そういう産学連携でやるというのも推奨してくれる雰囲気があるので、今後もいろんな分野の方とおもしろいデータの活用の仕方を探せればいいなと思ってます。

司会者:ありがとうございました。