LINEはデータを活用することに対してすごく前向き

高口太朗氏(以下、高口):具体的なLINEのデータサイエンティストの仕事内容について、メンバーのみなさんとパネルディスカッションでお話しできればと思っています。まず私がマネージャーを務めるData Science室 Data Science2チームについて紹介いたします。

Data Science室は担当分野によって4つのチームに分かれているのですが、今日のパネルディスカッションのメンバーは、私を含めて全員がData Science2チームに属しています。メンバーは他にあと2名いまして全部で6名です。担当の領域はコミュニケーションアプリ「LINE」の各機能とスタンプ事業、そして「LINEポイントクラブ」など複数の機能やサービスに関わる横断的なプロジェクトです。よくある分析の例としては、UI変更やロジック変更のA/Bテストや新しい企画の利益とコスト試算。あるいは個々の施策のターゲティングや効果検証などを担当することが多いです。

ここからは、私以外の登壇メンバーについて一人ひとり自己紹介していただきたいと思います。まず、大塚さんお願いします。

大塚優氏(以下、大塚):Data Science2チームの大塚です。よろしくお願いします。私は2019年の2月にLINEに入社しました。前職でもデータ分析をやっていまして、そのときはB to B向け、企業向けに受託でデータ分析をしていました。

LINEでは、「LINEポイントクラブ」「LINEウォレット」のような複数のサービスに関わる領域をサービス横断で見ていく分析を主にやっています。

LINEに入社した理由は、会社全体でデータを使っていく姿勢があり、データを活用することに対してすごく前向きな会社なので、きちんと分析した結果をプロダクトに活かしていける土壌ができていると思ったからです。データ分析をする一個人として、すごく魅力的な会社だなと思い入社しました。

多くのデータサイエンティストが切磋琢磨しながら仕事ができる環境

谷川奈穂氏(以下、谷川):谷川奈穂と申します。2019年5月に中途入社でLINEに入社しました。前職はWeb IT企業のEコマースサービスの分析を行っていました。今、担当しているプロジェクトは主に2つで、各プロジェクトの機能の画像をスライドに貼っています。

スタンプを送信するときに利用するスタンプキーボードと呼んでいる機能(画像左下)と、LINEアプリを開いて一番左端のホームタブにあるバースデー機能 (画像右下)の分析などを行っています。

LINEに入社した理由は、今のチームもData Science室全体で見ても多くのデータサイエンティストの方が働いていて、一緒に切磋琢磨しながら仕事ができる環境がいいなと思いました。あとは、自分の引き出しを増やしてさまざまな手段で問題を解決できればいいなと思っていたので入社した次第です。

湯谷啓明氏(以下、湯谷):湯谷と申します。入社したのは3年前の2018年です。前職はデータ分析ではなくWeb系のIT企業でインフラエンジニアをやっていました。データ分析に関わる仕事がしたいなと思い、データサイエンティストとしてではなくてエンジニアとして入社して、その後データサイエンティストにジョブチェンジをしたという経歴になります。

今はスタンプショップに関する分析と、「LINEスタンプ プレミアム」という定額制サービスの分析を担当しています。よろしくお願いします。

高口:ありがとうございます。それではさっそくパネルディスカッションの1つ目の質問に入りたいと思います。中途の面接、あるいはカジュアル面談でよく聞かれる質問ですが、「データ分析でもっとも貢献できたプロジェクトは?」についてみなさんにおうかがいしたいと思います。

データ分析でもっとも貢献できたプロジェクトは

高口:さっそく大塚さん、データ分析でもっとも貢献できたプロジェクトは何か思いつきますか?

大塚:そうですね。印象に残っているのが「LINEポイントクラブ」というサービスのデータ分析です。「LINEポイントクラブ」というのはLINEの中のいわゆるポイントプログラムで、LINEポイントの獲得の実績に応じてランクが変動し、LINE Payの特典クーポンやLINEポイント還元などの特典が受けられるサービスです。ランク変動の仕組みはだいたい1年ぐらい前にリリースされ、今年の4月まで運営され、その後は一律のサービスとなりました。

当然ポイントバックでコストがかかるので、特典の内容を適宜見直しながら費用対効果を最大化していきたい、という企業側のニーズがあります。毎月、効果を見ながら特典の内容を変えていくプロセスがあり、そこにデータ分析で貢献していく必要があります。

いろいろなサービスが「LINEポイントクラブ」に関わっているので、ユーザーあたりの価値をきちんとモニタリングできる仕組みを作って、サービスがローンチされてからどういう変化があるか、各サービスの事業価値にどんな影響があるかを測定します。具体的にはライフタイムバリューですね。

将来的に得られる売り上げに対して、今かけているコストがきちんとペイするのかをモニタリングしながら、「ここのセグメントは効果が薄そうだから特典の内容を変えてみよう」みたいなことを判断しサービス内容を変えていくために、ダッシュボードを作って事業サイドに提供しました。

月1でいろいろ特典の内容を変えていくというニーズに応えるスピード感に分析として付いていくのがけっこう大変でしたが、プラスLINE上の何百万人、何千万人というユーザーが関わっているサービスの内容の意思決定に寄与するために分析内容を提供することができたのが、個人的に貢献できた点かなと思います。私の中で印象に残っている、データ分析で貢献できたプロジェクトの1つですね。

プロダクトの利用状況から根源的な課題を炙り出す

高口:ありがとうございます。私も一緒にやっていましたけど、スピードもそうですし複数のサービスを同時に見ないといけなくてなかなか大変でした。大塚さんの得意分野の良さが、すごく出ていたプロジェクトだなと私も思っています。ではもう1人お答えいただきたいのですが、谷川さんいかがでしょうか?

谷川:私が貢献できたプロジェクトとして挙げるとすると、スタンプキーボードの改善プロジェクトです。自分の分析から改善していく方向性を提案できたというものになります。

先ほどの私の自己紹介のときにスタンプキーボードの話をしたと思いますが、ユーザーのスタンプ送信回数を増やすことが目標として動いているプロジェクトになります。

分析にあたり、そもそもどういうところを改善したらいいのかがまったくわかっていなかったので、1ヶ月のスタンプ送信回数をもとに、全ユーザーを大きく5つのセグメントに分けて、スタンプが実際にどれぐらい使われているのかを確認しました。その分析結果により、あまりスタンプを送っていないユーザーが、想定以上いることがわかってきました。

そういうユーザーについて、どういうユーザー行動をしているのかを深掘り分析したところ、テキストを入力するとスタンプがレコメンドされて使えるようになる「オートサジェスト機能」を改善していくことが、スタンプ送信回数の増加につながるということがわかってきました。

現在は、スタンプキーボードのプロジェクトでオートサジェスト自体の改善を進めています。

高口:ありがとうございます。そのプロダクトの根本的な利用状況からどこが一番根源的な課題かを炙り出して、プロジェクト全体の方向を進めるということですね。

データという共通言語でいろいろな部署のハブになる

高口:次の質問にいきますね。2つ目はスキルの話です。先ほどお話いただいたような具体的な業務内容を通じて、そのデータ分析でいろいろな面のスキルがあると思うんですけど、身につけたことって何か思いつきますか?

湯谷:私はA/Bテストの業務を担当することがけっこう多いので、LINEの規模でA/Bテストを回していく経験が身についたと思っています。

規模というのは、扱うデータの量や動く金額、関わる関係者の多さなどいろいろ定義があると思います。その規模に見合ったサンプルサイズの設計や、リリース時の判断のための集計のやり方はもちろんのこと、そもそもA/Bテストをやるべきかを事業側と話し合ったり、メトリクスを取るために必要なログについて開発側に相談したり、テストが終わったあとにアルゴリズムの改善について機械学習エンジニアに相談したりと、A/Bテストの改善のサイクルをどうやって回していくかを、社内のいろいろな関係者と関わりながら学ぶことができました。

高口:ありがとうございます。確かに我々がデータという共通言語でいろいろな部署のハブになることがけっこう多いと思います。「LINEの規模で」というお話があったと思うんですけど、例えばA/Bテストの対象となるユーザー数は、どういう規模になるんですか?

湯谷:ものによりますが、何百万ユーザーとか何千万ユーザーとかが対象になる感じです。

高口:たとえば数パーセントほどのサンプリング率でも、やっぱりかなり多くのユーザーに影響を与え得るなと、我々も感じるところですね。ありがとうございます。

この質問についても、もう1人お答えいただきたいのですが、谷川さんにお願いしてもいいですか?

どうすれば全体の改善につながっていくのかを、明確に伝える

谷川:自分で言うのもおこがましいのですが、分析を通じて人を動かす力が、自分の中でちょっとずつ身についてきていると思います。その手段は大きく2つあり、私自身もKPIの作成と分析レポートの書き方を工夫するようにしています。

KPIの作成については、KPIをいろいろ設計してKPIツリーを作り、関係者に見ていただき馴染むようにしてもらう、ということをみなさんもやられているかと思います。私はそこに各関係者の人たちがどういうことをやっていけば全体の改善につながっていくのか、明確に伝えるように工夫を加えています。

LINEでは複数の部署間で多くの関係者が一緒に仕事をしているので、KPIツリーを見せて、お互いがどういうところをがんばっていけばいいかを伝えることで、一体感を得ることにもつながると思っています。

もう1つの分析レポートの書き方の工夫についてですが、私もA/Bテストの例を出してお話しします。特に、どのテストグループを、なぜ採用したほうがいいのかが明確に伝わるように、気をつけています。LINEでは1つのモジュールについてUI変更を行うことで、前後にあるUIやモジュール、また前後のページにあるモジュールまでKPI数値が変わったりすることがあります。

ですから、実際にA/Bテストをやる前に、どういう評価指標で確認していくと良さそうかなどの設計もやっていますが、それだけではなく、関係者がユーザーの行動のどういうところが気になっているのかなど、いろいろな視点を踏まえながら全体の分析を解釈するように工夫しています。

高口:谷川さんは特に、ユーザーの方へのインタビューに傍聴者として同席するなど、視点を広く持って分析に活かすことをやられていますね。ありがとうございます。

実績を積み上げてきたことでいろいろな事業側から信頼が置かれている

高口:最後の質問ですが、これもカジュアル面談とか面接でよく聞かれる質問で、「LINEのData Scienceチームならではの良さ」です。

もちろんいろいろな企業にデータサイエンスの組織、あるいはデータサイエンティストのポジションがあると思いますが、LINEのData Scienceチームならではの良さをみなさんにうかがいたいと思います。こちらはたぶん、みなさんそれぞれにあると思うので順番に答えていただきたいと思います。

では、大塚さん、LINEのData Scienceチームの良さって何でしょう?

大塚:私が個人的に感じているのは、やっぱりさっきも言ったみたいに会社全体できちんとデータを活用していこうというカルチャーで働けるのがいいなと思っています。私が入社する以前からさまざまな事業においてデータ分析の実績を積み上げてきたことで、Data Scienceチームとしても各事業側から信頼が置かれていると思います。

きちんと会社の中で重要に位置付けられているチームなので、実際に分析プロジェクトを始めるときにも「そもそもなぜ分析が必要なのか」みたいな啓蒙活動はほとんど必要ありません。「具体的にどんな分析の課題を解決していきましょうか」という段階から議論ができます。

仕事のスタートラインが高い位置から始められる、データが整備されているところも分析者として働きやすい会社だと思います。

高口:ありがとうございます。それは私も思うところがすごくあります。いくつかA/Bテストの例が出ていますが、あれは開発側からするとどちらか使われなくなってしまうパターンを作らなければいけません。コストがかかることですが、いままでの信頼関係を築いている我々が提案することによって「Data Scienceチームが言うなら」と難しいテストでも実装していただいているところはあると思っています。

次に、湯谷さんに回答をお願いしてもいいですか? Data Scienceチームならではの良さってなんでしょう?

求められる成果を出していれば、ある程度自由にできるカルチャー

湯谷:これはLINE全体に言えることだと思いますが、自由というのが良さの1つかなと思っています。例えば、私は分析業務の他に社内向けにRパッケージみたいなものを作っていますが、それをOSSとして社外に公開したり、あるいは海外のカンファレンスに発表に行ったりという経験もしています。そういうことを応援してくれる、求められる成果を出していればある程度自由にしていいというのが、カルチャーとしてある気がします。

チームとしても目の前の課題だけではなく、自由研究的なタスクを持つことや、短期的には求められていないけれど長期的に解き明かしていかないといけない問いを分析することが奨励されていて自由にやれるところが良さかなと思っています。

高口:ありがとうございます。確かに我々のチームだけじゃなくて、全社的に自分が事業のために、良いと思ったことは積極的に行う文化はありますね。湯谷さんがおっしゃったようなOSSの活動は、当然社内外に対して技術力の高さをアピールすることになりますし、非常に有意義な活動だと思っています。ちなみにふだんは自由研究的な長期限タスクにはどれくらい時間を使っていますか?

湯谷:時期によって違いますが、今はけっこう時間が空いているので週に半日ぐらいという感じですかね。

高口:なるほど。良いことだと思います。ありがとうございます。

司会者:では、パネルディスカッションをこのあたりで切り上げたいと思います。ありがとうございました。

ユーザー数の多さは大きなやりがい

司会者:ではここからQ&Aに移りたいと思います。「データ分析利用方法としてデータベースからの知識の発見、KDDも多いと思います。得られた知識は今後データ分析をスキップすることも多いと思います。そこで検証と効果確認のどちらを優先されますか?」。

高口:「1回わかって新事実だと思ったことは、その後スキップすることが多いか?」というご質問内容であってますでしょうか?今、理解したとおりだとすると、LINEのアプリの使われ方とか、あるいはユーザーの方の動向というのは日々いろいろなスパンで変わり得るんですね。

ですから、一度何かのテストで得られた知識はそのままではない、というのが前提だと思っています。その意味では一度検証したことを含んでいたとしても、時期が経っていればそこも含めて効果の確認を行う必要があるので、使い分けが重要かなと思います。

司会者:ありがとうございます。では次に参ります。「Data Scienceチームでの一番のやりがいは何でしょうか?」と、ストレートな質問をいただいています。

谷川:サービスに対してのやりがいという意味で言うと、利用者が本当にたくさんいるので、少しの改善でも大きく違いが出てきたりとか、良い面もたくさん出てきます。やっぱりユーザーの人数というところが、自分の中でも大きなやりがいになるかなと思っています。

あとデータサイエンティストの仕事のやりがいとしては、いろいろな人たちと一緒に仕事をしていて、いろいろな案件に関われるので、自分のできる手段を本当にたくさん知ることができます。今だと、週に1回の定例会議で自分の分析内容を話す機会があるのですが、1個の問題に対して、みんながどんな手段で解いているのかを知ることができるので、それはすごくおもしろいと思っています。

どのメンバーでも同じレベルのアウトプットを出せることを目指す

司会者:ありがとうございます。次の質問です。「分析案件はどうアサインされるのでしょうか?興味があれば拾えるのでしょうか?各自業務に配属されるという話もありましたが、優先順位はどう決めるのでしょうか?」。

高口:そうですね。まず、基本的にはメンバーごとの主な担当領域が、緩やかに決まっています。ですから、継続して同じ領域の案件を担当することが多いと思います。一方で我々のチームは、どのメンバーでも同じレベルのアウトプットを出せることを目指しているので、あえてふだん取り組んでいない分析に対して、経験のあるメンバーとたくさんペアでアサインすることによって、全体としてスキルアップとか技術の向上を図ることも行っています。

司会者:ありがとうございます。続きまして「LINE自体への興味が弱く、解析技術に興味があるデータサイエンティストはあまりこのチームに適していないと認識しているのですが、あっていますでしょうか?」。

高口:ハッキリYesと答えにくいですけど、やっぱりサービスに対する思い入れとか理解があることは、サービスを実際に開発している人とか企画している人とコミュニケーションを取る上では大事かなと思っています。一方で、誰もがみんな「LINE」のヘビーユーザーではないことは理解しているので、そういう視点も分析を進める上では大事だと思っています。

LINEのデータサイエンティストが普段から利用している言語は?

司会者:それでは最後の質問に参ります。「みなさんの好きな言語はなんですか?」

高口:私は分析に使えるのはRだけなので好きな言語はRです。

谷川:私はもともとPythonをよく使っていたんですけど、チームの中ではRを使う人がけっこう多いので、自分の勉強のためにもRを使うようにしています。

大塚:私も基本的にはPythonしか使えない人なんですけど、Rを使ったビジュアライゼーションはすごいなと思うので使えるようになりたいなと思いつつ、基本的にはPythonメインでやっています。

湯谷:私はRを使うことが多いですが、前職ではPythonを仕事で使っていました。どっちも好きというほどではないです。

(一同笑)

司会者:参考になりましたでしょうか。みなさま回答ありがとうございました。