一休のデータサイエンティストの仕事

――まず、簡単な自己紹介からお願いします。

大西健太氏(以下、大西):大西と申します。2016年11月に、宿泊事業部の開発(バックエンド)として入社しました。そこから、一休に来られているビジターさんのログを集める基盤を作ったり。

その関係もあり、2017年10月にデータサイエンス部を立ち上げる時に異動しました。それから、ダイナミッククーポンと呼んでいるポップアップでビジターへクーポンを配信する機能やマーケティングオートメーションツールの開発ですとか、レコメンドエンジン……今はあいまい検索に取り組んでいます。

――ということは、「データサイエンティスト」という肩書きでは入社されていないんですね。

大西:そうですね。もともとは、アプリケーションエンジニアとして採用されました。

――一般論として、「データサイエンティスト」はどんなポジションなのでしょうか?

大西:マーケティング・営業あるいは企画等の施策を実現するために、分析から入ってモデルを作って、サイトから利用できるようにアプリケーション化する、までが一般的なデータサイエンティストの守備範囲ですね。

――それと比べて、一休のデータサイエンティストはどんな役割なのでしょうか?

大西:基本的には、この流れからあまり変わっていません。ただ、もう少し守備範囲が広い点が特徴ですね。現状はデータサイエンス部合計でまだ7人です。

基本的に、社長の榊やマーケティングチームが狙った施策を実現するために、分析から始めて、それをアプリケーションまで落とし込んで実装しています。場合によってはサービスを組み込むところまで、自分でひと通りやっているかたちになりますね。

――一般的なデータサイエンティストより、もう少し求められるスキルは広いですか?

大西:そうですね、範囲が広がります。アプリケーションを開発するときはPythonやWebアプリケーションフレームワークだったり、あるいはサービスに組み込むのであれば、サービス側の言語・フレームワークをある程度理解している必要があります。

技術的なところで言いますと、今データサイエンス部で使っている言語は、ほぼPythonです。Webアプリケーションを作る場合ですと、Flaskを採用することが多いです。これは、レストランサービスのアーキテクチャを踏襲しています。かつ、機械学習などで使いやすいPythonを選択しているというかたちです。

――Pythonはチーム全体で使われているのでしょうか?

大西:今は、チームのほぼ全員がPythonを使っています。先ほどのマーケティングオートメーションツールや営業活動を最適化するための営業支援ツールなどを作っているのですが、それも全部Pythonです。

データサイエンス部のミッション

――ここからはチームのお話について、もう少し深掘りさせていただきたいのですが、今は5人のチームということですよね。

大西:そうですね。

――データサイエンス部が立ち上がったのはいつ頃でしょうか?

大西:2017年10月にデータエンジニアリング部と、私が所属していた宿泊開発部プラットフォームチームから2人と、マーケティングから1人が集まってできた部です。立ち上げ当初は6名でした。

――データサイエンス部に求められているミッション・役割はどんなことでしょうか?

大西:現在在籍する5名の内訳は、アプリケーションエンジニアが2名、データサイエンティストが2名、データプラットフォームエンジニアが1名という構成になっています。人数は少ないですが、プロダクトは6〜7つありますので、場合によってはオーバーラップしながら、それぞれの領域をカバーしています。

データサイエンティストに関して言うと、私ともう1人がいます。先ほども申しましたが、アプリケーションの実装や、場合によってはサービスへの組み込みまで、この人数でカバーしていかないといけません。

あとは、先ほどのあいまい検索・レコメンド・クーポン配信など、統計モデルや機械学習等を使ってアプローチしていかないと解決できない問題を扱っており、そういった要素を持った課題に取り組んでいます。

ミッションとしては3つあります。

1つ目が、マーケティングオートメーションツールや営業支援ツールといったアプリケーションを内製していますので、その運用・保守と改善をしていくことです。

2つ目が、データプラットフォーム的な観点で、どんな施策・課題においてもそうですが、やはり元になるデータがないと分析できません。それらのデータは、全て1つのSQL Serverに集約しています。一休ではデータウェアハウス(DWH)と呼んでいます。DWHを健全な状態に保って運用・保守することと、DWHに必要なデータを持ってくるETL処理がありますので、そのメンテナンス・改善をしていくこと。

最後が、データサイエンティストとして、レコメンドやあいまい検索。実際のサービスを通して、ユーザーへより高品質なユーザ体験を提供していくこと。

これらの3つのミッションを持っています。

マーケティングオートメーションツールも内製化

――「マーケティングオートメーションツールを内製化している」ということですが、それを作ったのはデータサイエンス部になってからでしょうか?

大西:そうですね。このツールについて簡単にご説明しますと、キャンペーンメールといった会員へのメール配信、今一休に来訪されているユーザーへのダイナミッククーポン配信、あとは、Webサイト上での通知ですね。こういったマーケティングの文脈でのユーザとのコミュニケーションを一括して管理しているものがオートメーションツールです。

配信対象ユーザを抽出して、HTMLメールやテキストメールのコンテンツを作成する。その人にとっておすすめの店舗や施設のランキングを作っていますので、コンテンツも人によって異なります。最後に、決められた配信日時に送るということを、全部1つのWebアプリケーション上で行っています。

これは2017年の8月ぐらいから作り始めました。データサイエンス部の立ち上げ直前くらいからですね。マーケターの方の手間を減らすとともに、いろいろな施策を並行して走らせられるようになりました。現状は、だいたい100施策ぐらいが同時に動いています。メールだと60~70ぐらいの施策で、それ以外がWeb通知やダイナミッククーポンです。これらを1つのアプリケーションで管理しているかたちですね。

――すごい。Web通知というのは、どのようなかたちでしょうか? ポップアップのようなものですか?

大西:サイトの右上の、例えば宿泊サービスでログインしていただけるとわかるのですが。Facebookと同じような、通知マークですよね。

前日までのデータから、例えば「この施設を予約して宿泊した人」を抽出して、その施設に近い施設を「おすすめ」として抽出する。さらに、そのおすすめ施設の画像を埋め込んだHTMLを通知メッセージに埋め込み、例えば14時のタイミングに配信しています。

こういった複数のチャネルを全部一括で管理するのは他のマーケティングオートメーションツールではできないので、完全にオリジナルとなってます。

社長直下で働くということ

――インタビューに先立ち、データサイエンス部の様子を拝見させていただきました。社長席ともすごく近くて、社長直下と言って差し支えない環境です。そんなチームで働くメリットやデメリットはありますか?

大西:一番大きなメリットとしては、解く課題自体を間違えるという失敗を防ぎやすいことです。やる・やらないの判断や、どういった優先順位でやるべきかを、ビジネス上の観点から答えを出せる人がすぐ近くにいることが、一番のメリットです。

私は、宿泊開発部の時にログ基盤の構築という仕事をしておりました。その時は、そもそもビジネス上で必要のないデータを取ろうとしていたり、逆にビジネス上で大事なデータが抜け落ちている……みたいなことがけっこうありました。要するに、無用なことに時間を使ってしまっていたという反省がありました。やはり、ビジネス上の観点で判断できる社長が近くにいることが、一番大きい利点かなと考えていますね。

――社長とは定例ミーティングなどで話すのでしょうか? 

大西:そうですね。隔週でミーティングの場を持っていまして、データサイエンス部は全員出ています。各人が1人1プロジェクトを担当する状態になっていますので、各プロジェクトについて全員に説明する場みたいになっていますね。

――ミーティングではどんな話をしているのでしょうか?

大西:そうですね。単純に「やったこと」も話しますし、「これからやろうとしていること」を説明して、場合によっては先ほどのやる・やらないの判断がありますし、「やるのであれば、こうやったほうがいい」というアドバイスをいただくこともあります。

例えば、先ほどの(榊社長の話にあった)あいまい検索のαβγの重み付けについて、もともと私は、検索ワードとの類似度だけでやろうとしていたのですが、定例ミーティングの場で、例えば榊さんに「僕の言う『デート』と君(大西)が言う『デート』は、だいぶ違うはずだ」という指摘を受け、「売上やユーザごとの好みなどの重みを全部足し合わせたランキングを、考えなければいけないね」というところで、方向修正などをしています。だいたい、隔週のミーティングの場ではそのような話をしています。

――大西さんはあいまい検索を担当されているとのことですが、もう1人のデータサイエンティストの方は、何のプロジェクトをされていますか?

大西:もう1人は、先ほどお話したダイナミッククーポンですね。「この人にはクーポンを出す」「この人には出さない」というロジックがあります。

これは、本当に純粋な予測問題に置き換えられます。クーポンを出さなくても予約する人であれば出さないほうがいいですし、逆に、出したら予約する人だとわかり、かつ、クーポン金額を差し引いた分でプラスになると予想されるのであれば、出してしまったほうがいいと思います。

だとすると、「クーポンを出したら予約する」「出さなかったときでも予約する」確率を出してみる。例えば割り算してあげて、「この人はクーポンを出すと、1.5倍(の確率で)予約するね」と予測できます。今は単純なルールベースでやっているので、そういったモデルを組み込むことで精度を上げていくところにフォーカスしていますね。

――なるほど。そちらのほうが、理論上できそうですよね。

大西:そうですね。非常に純粋な話だと思います。

――榊社長はかなりデータがわかる社長ですよね。

大西:はい。先ほどもJupyter Notebookでリマーケティングメールに関する予測をされていました。そういったことを自前でされています。例えばレコメンドも、実は裏で、榊さんがSQLで書いたロジックが動いています。

――社長が書いたロジックが動いているというのは、なかなか聞かない話ですね。

大西:そうだと思いますね。ロジックに対する理解も深いですし、非常にそのあたりの説明をしやすい環境だと思います。逆に言いますと、中身のこともわかっていらっしゃるので、「もっと速くできるだろ?」とか(笑)。作業の工数感もなんとなくわかっていらっしゃるので、「一生懸命やらないといけないな」というところではありますね(笑)。

――誤魔化しがきかないというか(笑)。

大西:そうですね(笑)。

働きやすさを感じるポイント

――ありがとうございます。働く環境についておうかがいします。1人のデータサイエンティストとして働きやすいと感じる部分は、どういったところでしょうか?

大西:先ほども申し上げたとおり、ビジネスの課題を一番良くわかっている方がすぐ目の前の席にいます。そういった意味だと、「やるべき問題か、解くべき問題か」を議論することが簡単にできます。無駄なことをする必要がないのは、やはり働きやすさとして、1つのメリットですね。

また、基本的にインフラは、全部AWSのクラウドに移行していますので、そういうマネージドなサービスを自由に使える環境があります。なので、自分で作ることができるのであれば、AWS内で完結できるという便利さはありますね。

――同じような環境を聞いたことがないので、御社はだいぶ特殊ですよね。レコメンドエンジンを書ける代表の直下で働けるというのは。

大西:そうですね。これは昔、けっこう研究されていたみたいです。

――先ほど榊社長がおっしゃっていた「AIに力を入れていくぞ」という会社の中でも、「どうせ、言っている社長本人がわからないんだろう?」みたいな課題感が、ぜんぜんないということですよね。

大西:そうですね。そこは、基本的にフラットだと思います。

――普通の会社では、社長に対するレポーティングコストが高いということもあるかと思います。

大西:そうですよね。なので弊社では、レポーティングをするときもQiitaのエントリーに各々が書いて説明するライトな方法を採っています。理解への敷居もほぼないですから、かなりスムーズだと思いますね。

もともと社長は宿泊事業部の部長をされていて、そこでレコメンドなどを自前で作られていたので、「そもそも、かなり興味が高いんじゃないかな?」という思いはありますね。

――なるほど。それでは逆に、「いまいちだな」「ここはこうだったらいいな」みたいなところはありますか?

大西:そういう意味ですと、やはり今の組織の規模上やむなしではあるのですが、基本的に1人が主体となって、最初から最後まで行動する必要があります。他と比べて守備範囲が異様に広くなってしまうんですね。

それは、データサイエンスの部分に主眼を置いている人にとって、場合によってはきついことがあるかもしれません。ただ、アプリケーションエンジニアや他のデータサイエンティストと組んで仕事をするような体制になってくれば、そこはだんだん改善されていくんだろうと思っています。

フィットする人材はどんな人か?

――それでは、御社にはどんな人材がフィットすると思いますか?

大西:そうですね、3つあるかなと思っています。

1つ目は、ビジネス的な側面でいきますと、「そのビジネスの課題を理解できること」。さらに「サイエンスの方面で、要件と制約にちゃんと落とし込めること」が、最初に一番大事かなと思っています。

2つ目は、「要件と制約を充足させるためのモデルを自分で考えて、場合によっては多少強引なりともモデル化して、実際のサービスに影響を与えていくこと」かと思います。

3つ目は、我々は基本的に答えのないところに取り組もうとしています。なので、「スモールスタートでも何でもいいので、ちゃんと少しずつ良くしていく計画と実行ができること」。

この3点が、一番大事かなと考えています。

――なるほど……そういう人って、いるのでしょうか?(笑)。

(一同笑)

大西:なので、このうちの2つくらいは欲しいところです。

――大西さんは、採用に携わっているのでしょうか?

大西:そうですね。一休では基本的に配属されるであろう部署の人間が面接・書類選考をやっている状況です。それぞれの部署が全員でやっている感じです。

――それでは、大西さんも何人かにお会いになったんですか?

大西:週に1人か2人ぐらいはお会いしています。

――コンスタントにお会いされるんですね。

大西:そうですね。ですが実際には、ミスマッチもありますので。マーケティングチームや、集客を行っているデジタルマーケティング部に見ていただく、ということもあります。

この「『データサイエンティスト』って何なのか?」というところが、曖昧な感じになっていまして。データプラットフォームといったインフラ寄りの人から、集客や広告など、そういったところに重きを置いておられる方もいるなと。現状は、まちまちで幅広い感じになっていますね。

――書類を見た時点で「おっ!」と思う人は、どんな経歴の方ですか?

大西:「おっ!」と思える人としては、先ほどの話にもあったあいまい検索やダイナミックプライシング・営業活動の最適化に近い問題を過去に取り組んでこられた方は、やはり最初に目を引きますね。実業務でそれをなさっている方であれば、先ほど話した2つ目の「要件や制約を充足させるモデルを作れる」というところには、なんとかマッチしていけると思っています。

あとは、「それは何を狙いとして行い、どういう結果・数字に結びついたのか」が書いてあると、ビジネスの観点的にもいいので、「それは◎だな」と思いながら進めますね。

また、現状は7人しかいないので、いろいろなツールを持って戦える人を……WebアプリケーションやDBの運用改善などがありますので、そのあたりの知識・経験があるとトータルにカバーしやすくなります。

他には、大学で機械学習やモデリングなどを研究されてから、例えばSIerなどにお勤めになった方。仕事としては1〜2年ぐらいやってきたものの、「分析やデータサイエンティストの仕事をやりたい」とか「アナリストとして舵を切っていきたい」という人は、お会いしてみてから判断する……という感じですね。今は、私ともう1人のデータサイエンティストがいるのですが、彼はそういった経歴ですね。

一休に転職しようと思ったきっかけ

――大西さんはもともとデータサイエンティストとして入社されたわけではないとうかがいました。「一休に転職してみよう」と思われた理由は、どういうものでしょうか?

大西:もともとは、私もSIerでエンジニアをやっていて、アプリケーションとインフラの両方を経験してました。非常によくある話ですが、SIerですから受託開発なので、「自社でWebサービスを作っているところにチャレンジしていきたいな」と思いました。もともと当時熱心だったのが.NET Frameworkで、一休のサービスはそれで構築されているということで一休に興味を持って。入社のきっかけは、そういうかたちでした。もともとは、普通に「Webアプリケーションを作りたかった」というモチベーションでした。

最初にお話ししましたが、入社後はログ基盤の構築に携わって、だんだん「CRMシステムが重要だな」と考えました。当時は、ヤフーでも販売し始めた頃だったと思います。

新規ユーザが増えてきたフェーズでしたので、今度は「そのユーザーさんを、もっとヘビーにしていきたいな」と思い始めて、CRMシステムに深く携わっていければと考えました。データサイエンス部の立ち上げ・異動後、実際にそうなってきました。このように、移り変わってきた感じですね。

――ちなみに、今は社内にデータサイエンス部がありますが、それとは別にエンジニアの方もたくさんいらっしゃると思います。そこから大西さんのように、データサイエンス部へ興味を持って来ることはありますか?

大西:意外とないんです。

――それは、志向性の違いでしょうか。

大西:今までやってきていない方々がほとんどだと思いますので、そういった意味では、志向性の違いもあります。

最近は、Webアプリケーションを作るにしてもそのインフラを作るにしても、規模の大きなサービスになってきています。それをプラットフォームから支えたり、そのためのサービスを作ったりすることも、とてもやりがいのある仕事なので、あえてそこから飛び出していくのは、けっこうレアケースだと思います。

それでも、もともと宿泊のバックエンドを開発されていた方がいるのですが、最近データサイエンス部のアプリケーションエンジニアとして異動してきていただいたこともありますので、もしかしたら今後も、社内での異動の流れはあるかもしれないですね。

データサイエンス部のこれから

――ありがとうございます。それでは最後に、データサイエンス部の今後の方向性や、将来像を教えてください。

大西:データサイエンスというか一休全体として、榊さんは「6つの課題」を挙げています。

「パーソナライズドなレコメンド」「あいまい検索」「画像の特徴を活かした検索」「音声による検索」「クーポンやポイントなどによるダイナミックプライシング」「営業活動の最適化」という6つの課題を挙げているのですが、それをチームで取り組める体制づくりが、最優先の課題かなと考えています。

そういった意味では、データサイエンティストは2人しかおらず、データサイエンティストの戦力不足が今の一番の急所になりつつありますので、それを補強していきます。さらに、チームとして分析から施策の立案・実施・効果測定・改善というサイクルを回していけるチームを作っていくことが、今後の方向性として一番大事かなと、私は考えています。

――ありがとうございます。それでは、データサイエンティストとして、今後どんなことをやりたいとお考えですか?

大西:私が今後やっていきたいこととしましては、予約サイトなので、検索が一番大事だと考えています。そうしたときに、やはりGoogleに先を超されないように、「サービスとしてユーザに提案する力をつけていかないといけない」というところは、まさに私も考えているところです。

よりユーザーにとって刺さる検索を実現して、ユーザがより良い食事・宿泊の体験を得られるように手助けしていきたいと考えています。なので、メインテーマは「検索」かなと思っていますね。

――やっていることが愚直ですよね。だから強いのだろうと感じました。

大西:そうですね。「サイエンス」と言いつつも、けっこういろいろなビジネスロジックを間に挟んでいますので。1つずつやっていって、その結果ユーザーに喜ばれるということを、ちゃんとチームとして指標に据えて取り組んでいければいいんじゃないかなと思っています。