Data Science & Engineeringセンターの4部門

勝山公雄氏:LINEの勝山です。データマネジメントを担当しています。本セッションに参加していただきましてありがとうございます。本セッションの目次ですが、最初にLINEグループ全体のデータマネジメントについて紹介し、そのあと金融データの活用について紹介します。

最初に、私が所属していますData Science & Engineeringセンター、略してDSEセンターについて紹介します。こちらは大きく4つの部門と役割に分かれていまして、1つ目がデータ利用に関する問い合わせやルール策定など、全体的なマネージを行うData Management室。

2つ目がデータ統合された分析環境をエンジニアによって環境構築するData Platform室。3つ目がデータ分析およびマシンラーニングによって新たなデータや情報を作成するData Labs。4つ目がシステムインフラを整備するEngineering Infrastructure室です。

配下には、ご覧のようなさまざまなチームが配置されています。

このDSEセンターのミッションは、Information Universeとしてデータ統合された分析環境を提供し、データの民主化を推進および支援することです。このInformation Universeに対し、マシンラーニングやデータサイエンス、データガバナンスの機能を盛り込んでいます。

Data Management室の4つの役割

続きまして、Data Management室のミッションは、安全安心なデータ活用を提供することです。社内のデータ活用ユーザーに対して使いやすく作られたインターフェースによって、データ活用を促進し、情報漏洩事故やデータの問題で間違った判断をしないように、安全なデータが提供されることを目指します。

Data Management室の役割は、大きく4つに分かれます。データ戦略、攻め、守り、システムです。これらを1つずつ紹介していきます。

データ戦略は人、物、金の観点から設計しています。人については、データ活用促進のために教育に力を入れ、人材育成を推進します。物については、データの理解を深める仕組みづくりを行なっていきます。金については、データから売上貢献や利益創出などの価値につながるような取り組みを進めていきます。

次に攻めとしては、Data Management室のデータプランナーが、Data Labsのデータサイエンティストやマシンラーニングエンジニアと協業し、事業のデータ活用を支援しています。

役割分担としては、Data Labsは、高度なデータ分析技術により大事な意思決定のためのインサイトを提供したり、レコメンデーションエンジンの構築や改善を支援したりして、Data Management室は、基本的なデータ活用、およびデータ分析の支援を幅広く行なっています。

守りとしては、日々の問い合わせ業務から入ってくるデータ活用に対する要望内容から、ボトムアップで共通項目を抽出することと、法令やセキュリティポリシーから必要となる守るべきことをトップダウンで策定し、これらを合わせてルール化の検討を進めていきます。

そしてまとめられた段階で、ドキュメントを作成し、告知およびセミナーを通じて、社内全社に浸透させていきます。さらに時間の経過によって変わってくること、こういったことに対応するなど定期的に見直し、更新を行ないます。

システムについては、分析環境にはどんなデータが格納されているのか、データカタログとして社内のデータ活用ユーザーに公開し、ユーザーがほしいデータについては、そのカタログから選んで申請し、Data Management室の担当者が承認を行うということで利用可能になります。また各事業により集まったデータから機械学習などによって生成したデータをデータプロダクトとして管理しています。

こちらは、データマネジメントのコミュニケーション設計を表した図になっています。データストラテジストがデータ戦略を策定します。そのデータ戦略の内容をData Evangelistが外部に伝えます。

事業やサービスからデータ活用に関する質問や申請などの問い合わせに対して、窓口対応を行います。同じく事業に対しては、Data PlannerとData Scientistが、先ほど申し上げたように協力して支援を行います。

また事業を横断するようなデータ活用などの難しい要件については、Data Govenorが情報セキュリティや法務の専門家と調整を行い、承認などを判断していきます。

Data Product Managerは、データ戦略に基づいたプロダクト設計を行い、マシンラーニングエンジニアやETLエンジニアと協議しながら、開発を進めます。このようなかたちで、さまざまな部門とのコミュニケーションが発生しています。

データマネジメントの研修プログラム

次にData Management室では、業務の経験や知識からデータの民主化に必要となる研修プログラムを実施しています。この研修プログラムは、Data Voyage Programという名前が付けられています。

事業におけるデータ活用の成熟度を設定し、このレベルを上げていくためのプログラムとして実施しています。攻めと守りとシステムに分け、ABCDの4つのカテゴリーを設定してプログラムを構成しています。

詳細なセッションメニューとしては、抜粋したものを紹介いたします。A1・A2のように採番しており、セッションごとに受講対象者を定義し、必要な時間と形式を設定しています。座学形式で短時間のプレゼンテーションのみで行うものや、少し長めに時間を取ってグループワークを行うようなものをいくつか用意しています。

今の時代、オンライン開催を中心としているため、収録したものを動画配信して、当日参加できなかった人や興味がある人は誰でも聴講できるようにしています。また、繰り返し実施する必要があるものについては、動画配信を中心に展開していきます。このように、オフライン前提の研修よりもはるかに効率よく展開できています。

金融事業におけるデータ活用

続いて、本セッションのメインとなります金融事業におけるデータ活用について紹介です。LINEの金融事業ではLINE PayやLINE証券、LINEスコアなどに加え、ご覧のようなさまざまなサービスが提供されています。

LINEでは、金融事業においてもユーザーIDがほかのサービスと一致しているため、グループ横断でデータを連携してデータ活用できそうという可能性が想像できます。一般的には、プライバシーポリシーに関係するユーザーからの同意があり、コンプライアンス上の問題がなければ、データが発生した事業のデータオーナーの同意のもとで、データ連携が可能になっています。

しかしながら、このコンプライアンスに相当するフェーズにおいて、対応すべきことが多く存在し、簡単にはデータ連携ができません。この対応すべきこととして、以下のことが挙げられます。

法律や規制の確認、管轄官庁の監査、合弁会社における業務提携契約、内部的な契約関係、そして税法上の留意点などです。ざっと並べただけでも、大変なことが想像できますね。だからと言って、難しいから何もしませんというわけではなく、それでも前に進めることにチャレンジしています。

データ活用については、3つの方向性があります。1つ目は自事業のデータを自事業で活用。2つ目はLINEグループのデータを金融事業のために活用すること。3つ目は逆に、金融特有のデータをLINEグループで活用することです。これらの3つの方向性について、事例を交えながら紹介します。

自事業におけるデータ活用については、ユーザーから見た体系に沿ってお話いたします。まずは、LINEアプリや関係する広告などにアクセスして、LINEの金融サービスについて理解していただき、ダウンロードなどをしてもらいます。

これらのアクションが、キャンペーン履歴やアクセスログとしてデータが取得されているんですね。次に口座開設や本人確認の書類や画像といったものを提出してもらいます。ここでも、データが蓄積されていきます。

無事に口座開設されると、ユーザーはいろいろな情報を閲覧したり、投資の方針を考えたり、そういった検討を重ねていくことになります。こういった閲覧データなども残っていきます。

そして、投資の方針などが決まったら、お金を入金したり、出金たりといった取り引きが開始され、トランザクションとして、履歴が残っていきます。これらの一連の行動が、すべてデータに残っていて、これをまとめ上げてKPI(Key Performance Indicator)のレポートとして、報告したり分析したりしています。

LINEグループのデータ活用

次に、LINEグループのデータ活用について紹介します。左手に金融事業のデータ、右手にLINEグループのデータを配置しました。この右手のLINEグループのデータは、ユーザーがLINEアプリをいろいろ利用した履歴から、機械学習によってプロファイリングされ、いわゆる下ごしらえがされます。

まず金融事業のデータから、金融事業のユーザーリストを抽出します。これをシードデータとします。次にlookalikeプログラムに、このシードデータを投げ込んで実行します。

このlookalikeプログラムは機械学習プログラムの一種ですが、シードデータとなったユーザーのIDと同じIDのユーザーが、LINEグループの中からいろいろなサービスをどのように活用しているかといったものを、下ごしらえしたデータから探索し、似ている人を探し出せるようになっています。

そしてシードデータは、別のユーザーに対して、シードデータと似ている人を似ている度合いでスコアリングし、75とか68といった数字を付加してリストアップされる仕掛けになっています。lookalikeとよばれるこのような仕組みが活用されています。

これの具体的な事例を紹介します。LINEポケットマネーの事例になります。左手にLINE PayとLINEポケットマネーが配置されています。LINEポケットマネーは少額ローンのサービスですが、借入と同時にLINE Payにチャージされるため、LINE PayユーザーのうちLINEポケットマネーの借入ユーザーをリストアップできます。

これをシードデータとしてlookalikeプログラムを実行することで、ターゲットリストを作成します。このターゲットに対し、LINE PayのLINE公式アカウントを使って、LINEポケットマネーのキャンペーンを実施しました。これによって、通常より数倍の申し込みの獲得に成功しています。

このように、lookalikeプログラムを使うということは、シードデータとした人たちは申し込みをしてくれる確率が高いということになりまして、その確率の高いユーザーと似ている人をたくさん探し出すことができるんですね。

LINEグループでの活用事例

続いて、金融特有のデータをLINEグループで活用した事例について紹介します。金融事業のユーザーリストと一緒に、金融サービスだから取得できるデータ、これをユーザー1件1件のデータに付加して抽出します。

先ほど下ごしらえという言い方をしましたが、この機械学習の中での正解データとして、活用します。こうすることによって、既存の予測データの精度を向上させたり、新しい予測データを生成できます。

具体的な事例としてLINEスコアの事例を紹介します。LINEスコアのサービスで、ユーザーから入力されたデータをもとに下ごしらえを行いました。これを広告サービスの中で、セグメント情報として新たな項目として活用できるようにしました。

これに対し、広告主が新しく増えた項目を、広告に有効そうなセグメントということで選択し、広告配信を実施しました。これによって、広く全体的に広告したものと比較して、セグメントでターゲット化したため、数倍の成果をあげることに成功しています。

Data Management室の今後の展望

続いて、今後の展望についてお話しします。抽象的ではありますが、Data Management室の現在のポジションはこちらです。データ活用の範囲を広げていくことで、グローバル展開を行っています。これを横軸として定義します。

次に縦軸に注目してほしいのですが、このデータを、データ販売やデータに関するビジネスを新たに始めて利益を創出するような取り組み、これにチャレンジしていきます。いわゆるプロフィットセンター化を目指します。

この2軸が重なり合うことによって、LINEのデータによる価値創出が最大化されます。データマネジメントを推進することで、データ統合やデータ分析による間接的な事業貢献だけでなく、データを事業そのものとした直接的な利益創出ができるようになるんですね。

最後にまとめます。金融事業のデータ活用を進めるために、LINEグループのデータも併せて活用することから、LINE全体のさまざまなデータを取り扱うことができます。また契約や承認など、いろいろなタスクを担う機能をもつことによって、事業をドライブする中核を担うことができます。

そして海外とのコミュニケーションも発生し、グローバル人材の育成にもつながります。このように、LINEのデータマネジメントは、全体的な幅広い活動で新しいチャレンジができることについて紹介できたと思います。

以上、ご清聴ありがとうございました。