高口氏の自己紹介

高口太朗氏:まずは私からData Science室の業務の紹介をしたいと思います。

最初に簡単な自己紹介をさせてください。私はLINEのData Scienceセンター Data Science1室で室長を担当している高口と申します。LINEには2017年に入社して、およそ5年が経過した状況です。我々の部署ではLINEのアプリ、みなさんが「LINE」と聞いて想像するようなLINEアプリを中心とするプラットフォームとしての機能の分析を担当しています。

LINEのアプリはコミュニケーションだけではなく、サービスなどのあらゆるコンテンツへの動線を提供しているので、そういう横断的なプラットフォームとしての機能の分析を我々の組織の主が担っています。ちなみに、前職まではアカデミックで研究者をやったりしていました。

データ組織の役割と位置付け

まずは前提となるところですが、LINEでは経営の判断とか事業の判断において、データを最重要視しているところがあります。そこに我々が活躍を求められているところです。

LINEの社員の行動指針として「LINE STYLE」というものがあり、その指針の中の1つに「Always Data-driven」。「感覚ではなく、データ=事実を信じる」というものがあります。データに基づいて事業の判断を行っていく材料を作るのが我々の役目です。

次に、今日のセッションに登壇する組織を含めて、我々の組織の位置付けについて説明できればと思います。データの組織はいくつかあって、それぞれの各組織で役割分担をしながら、全体としてLINEのデータ活用でそれぞれのミッションを目指しています。

まず大きく分けると、データ組織にはData EngineeringセンターとData Scienceセンターがあります。我々データサイエンティストの部署は、Data Scienceセンターに所属しています。

我々の主な業務内容は、事業の責任者あるいはプロダクトの責任者の意思決定を支援するためのデータ分析を実施することです。つまり、データを加工したりとか統計的に分析(したり)することによって、人が判断できるための材料を提供するのが我々の役割です。それを実現する中で、我々ができないところを他の部署と協力しながら実施していくかたちになっています。

Data Science室の具体的な業務

次に、Data Science室の具体的な業務について説明したいと思います。まずはData Science室のミッションについて、より詳しく説明します。Data Science室は横断的な組織で、直接何かの事業の中に所属しているわけではありません。なので、各事業が持つプロダクトを、それぞれ小さなチームを作って担当するかたちになります。

我々が分析を担当しているプロダクトについて、サービスとしての競争力を最大化することがミッションの1つになります。例えばデータを活用して機能やサービスを継続的に改善していく仕組みを作ることも1つですし、専門性がないと解決できないような、事業的に重要かつ難易度の高い課題を解決するところが我々に求められているところです。

もう1つ、LINEという会社全体のデータ活用レベルを向上させるところも我々に求められている役割です。我々はLINEの中でデータを活用する部署の中の1つなので、広く他の部署でもデータを活用できるようになるために、我々がデータ活用レベルを底上げしたり引き上げたりすることを行っています。

具体的には、良い分析の事例を共有したり、あるいは我々が共通して使うようなライブラリやドキュメントを共有することを行っています。この2つを業務を通じて実践していくことが、我々データサイエンティストのミッションです。

具体的にどの事業領域をサポートしているかを簡単に説明したいと思います。(スライドを示して)ここに挙げているのは1つの例だと思ってもらえればと思います。Data Science室は実は2つの組織からなっていて、私(が所属している方)の組織のData Science1室と、もう1つData Science2室があります。それぞれ広範囲の事業を担当しているために、事業領域ごとに分けているかたちになります。

まずData Science1室は、LINEアプリに関連する事業です。LINEアプリそのものとか「LINEポイント」とか、スタンプショップとかを担当しています。もう1つは法人向けのサービスとして、LINE公式アカウント、LINE広告の分析を担当するチームも我々の部署の中にあります。

Data Science2室については金融関連のサービスです。「LINE Pay」を中心とするファイナンシャルのサービス。もう1つはLINEのファミリーサービスと呼ばれる「LINEギフト」とか「LINE MUSIC」といったようなサービスにまたがる横断プロジェクトを担当しています。

データサイエンティストとして新卒で入ってもらうと、Data Science1室、Data Science2室のどこかのチームに配属されるかたちになります。この2つは組織としては分かれていますが実際の業務は一体として運用していて、それぞれ協力しながら事業を進めている状況です。

実際にどのように担当サービスと関わるかということについて、簡単に図を用いて説明したいと思います。我々のチームは横断的な組織で、特定の事業に特化して所属をしているわけではなく、先ほど紹介したようないくつかの事業、LINEアプリとかLINE公式アカウント、LINE広告といったところと連携して業務を行っています。

Data Science室の中で、例えば担当領域ごとに2、3名とかの小さいグループを作って、そのグループの中である事業に取り組んでいく。これらのメンバーの中で実際の業務の中でコードを共有したり、あるいは一緒にレポートを書いたりというかたちで直接的に協業を行っています。

大きなData Science室としてはどういう業務を連携しているかというと、例えばあるサービスで実現できた良い事例を定期的な事例共有会で共有したり、例えば論文だったり教科書を読んで知見を高め合うこともData Science室の単位で行っています。このように、事業領域を越えてデータサイエンティストとして他のメンバーと切磋琢磨できるところが、我々の部署の良いところかなと思っています。

(LINEという)企業において、実際に我々データサイエンス(の担当者)がどのように業務を行っているのかを説明したいと思います。もっとも大きなところは、1つのデータサイエンスのプロジェクトを行って終わりではなくて、改善の実施をサイクルとして回していくことを重要視しています。

(スライドを示して)具体的にはこの図にあるように、まずはデータを観測したり、あるいはサービスの担当者と話す中から現状を理解して、何が課題なのかを議論していきます。

次に解決すべき課題とか、あるいは検証すべき仮説を設定します。それを定常的に評価できるようにするところが我々の専門性が発揮されているところです。

次に、設定された課題に対してどのような解決策が考えられるかを検討して、実装を行います。それは例えば統計的なモデリングであったり、あるいは簡単な集計で終わるかもしれませんが、求められている精度や解を出すことに要求されている期間、どれだけのスピードで求められているかを組み合わせながら、適切な手法を選ぶということを行います。

最後に検証です。実際のオンラインの環境において、解決すると設定したものが実際に機能するかを実証します。その実証されたものに基づいてサービスに反映されていきます。そして、次は実装されたサービスで新たにデータの観測を行って想定どおりに動いているかを検証して、またサイクルがつながっていくかたちになっています。

実際のプロジェクトの進め方

最後のパートになりますが、1つ例を挙げて、実際にどのようにプロジェクトが進められているかを紹介したいと思います。(スライドを示して)以下は2021年の「LINE DEVELOPER DAY」というカンファレンスで公開されている内容です。こちらではLINE PayについてLINE公式アカウントのメッセージ受信体験を改善することを、データサイエンスを通じて行いました。

LINE PayではLINE公式アカウントを持っていて、LINE Payのサービスですとか、あるいはクーポンなどの情報がユーザーのみなさまに届くかたちになっています。これに関しては、もともとは多くのユーザーに対して一律なメッセージが、同じタイミングで送付されるかたちになっていました。しかし、実際にはユーザーそれぞれによって必要な情報が異なることが考えられます。

そこで各ユーザーに適切な情報を届けることで、LINE公式アカウント配信の価値を高めていくことがプロジェクトの目的でした。これはLINE Payのユーザー数とかメッセージの量を考えると、データサイエンティストがいなければ解けない問題です。

具体的に何をやったかですが、まずはメッセージによって有益さ、人によってさまざまな観点があると思いますが、それを計測可能なかたちで定量化することを行いました。

問題を読み替えてメッセージを配信したことによって、そのメッセージが有益じゃないと反応され、LINE公式アカウントなどをブロックされてしまうユーザーのネガティブな反応を分析してモデリングを行いました。そして、配信に起因するブロックが、最小化されるものが良いメッセージであると問題を定式化しました。

ここでは統計モデリングとか、あるいはモデルの検定という手法が使われています。

さらにどのようなメッセージが有益かを測れるようになった段階で、ターゲティング配信そのものの精度を改善することを行いました。これにはMachine Learning室で開発された、類似ユーザーを抽出するようなツールを活用しています。

我々が機械学習のツールの社内ユーザーとして、それを実際にサービスに組み込むということを行いました。ここで新しいロジックでオンラインのA/Bテストを行い、送付するメッセージの数は削減しながら、実際に獲得する新たなユーザーの数は保つというような、効率良く、かつユーザーの方に届いても有益な情報となれるような配信を実現することができました。

LINEのデータサイエンティストで働く業務のやりがいと難しさ

最後にまとめとしてメッセージを伝えられればと思います。LINEのデータサイエンティストで働く業務のやりがいと難しさをよく聞かれることがあって考えました。

やりがいとしては、我々自身もユーザーだし、誰もが知るようなかつ国際的にも利用されているサービスに直接的に貢献できることが大きなやりがいかなと思っています。

反面の難しさとしては、データが多種多様であって巨大で、その環境に慣れるだけでも時間がかかってしまうような規模になっています。また、サービスも長年運用されているものも多くあり、データサイエンスで成果を上げるには、事業について深く理解をして自分自身の問題として捉えるということが必須になってくることが1つ目の難しさかなと思っています。

これから入ってもらう新卒のみなさまに期待したいところは、社内は分析環境が非常に整えられていて、データが分析に使える状態になっています。なので、良い環境を使って分析者としてのキャリアの基礎を培ってもらえればと思っています。

またLINEというと、すでに普及して十分広く知れ渡っているサービスと思われているかもしれませんが、世の中の環境は変わります。

他社であったりとかユーザーが求めるものは変化していくので、そこを捉えて、変化し続ける先進的なサービスを実現するためにはデータ分析が必要不可欠だと思っています。そこをみなさんの専門性を活かして一緒に実現していければと思っています。

私からの内容は以上です。ありがとうございます。