自己紹介とアジェンダ

前田和寛氏(以下、前田):それでは「LINE Fukuokaにおけるサービス運営業務のKPI可視化と業務量予測の実践」について発表します。よろしくお願いします。

まずはじめに自己紹介します。私はLINE Fukuoka株式会社の前田と申します。開発センターのData LabsにあるData Analysisチームで、チームマネージャー兼データサイエンティストとして働いています。ロールとしましては、サービス業務のサービスやプロジェクトの運営および社内における業務改善を促進するような分析の実施、およびそれらの分析案件におけるマネジメントをしています。

私個人のスキルとしては、R言語をメインに分析の実行やあるいはそれに関連する開発を得意としています。

さて本発表のアジェンダです。まず、LINE Fukuokaという会社について説明したあとに、オペレーション業務におけるissueについて取り上げます。そして、そのissueに対して私たちが取り組んだ2つのプロジェクトを紹介します。そして、今後の方向性についてお話したいと思います。それではさっそく始めたいと思います。

LINE Fukuokaとは

まずはLINE Fukuokaについて簡単に説明します。LINE Fukuoka株式会社は、LINEグループの国内第2拠点として設立されました。現在LINE Fukuokaでは大きく4つのロールがあります。まずは設立当初から担っているオペレーションです。LINEが展開する数多くのサービスについてカスタマーケアや審査などを請け負って、継続的にサービスを提供することに貢献しています。

次にクリエイティブや開発も担当しており、LINEのサービスなどにおけるアプリケーション開発やクリエイティブをサポート、提供しています。またビジネスプランニングも行っていますし、さまざまな企画戦略も行っています。本日はこの4つのロールの中でもオペレーションに焦点を当ててお話します。

Always Data-drivenに向けての3つのフェーズ

それではオペレーション業務における課題についてお話します。LINEにはLINEらしいやり方・考え方をまとめた行動指針となるようなLINE STYLEというものが定義されています。その中にAlways Data-drivenという項目があります。これは常にデータに基づいて判断・意思決定をしていくということなんですが、私の中でこのAlways Data-drivenをしていくためには大きく3つのフェーズがあると考えています。

それがこちらの3つです。まず始めにCollect。いろんなデータソースが発生しています。その発生しているデータを1ヶ所に集約し、後の分析に展開しやすいようにデータを整える必要があります。次にAnalyse。集約して整理したデータを用いて必要な指標を算出し、それを分析および可視化していくことでそれぞれに眠るissueというものを抽出していくものになります。

そして最後にApply。時系列予測であったりあるいは機械学習などを適用することなど、分析結果を事業に組み込んでそしてそれを回していくところかと思います。

3つのNOをBUILDに変える

さて、もちろんLINE Fukuokaのオペレーション業務においてもデータドリブンを進めていきたいのですが、残念ながらそれを阻害する3つのNOが存在します。それはデータ集約におけるNO、統一的な指標および可視化フレームワークにおけるNO、そしてデータ活用における組織横断的なプロジェクトのNOというものです。

そこで私たちはこれら3つのNOをBUILDに変えるところから始めていきました。これは現在ももちろん進めているところなのですが、本日はそこに関わる2つのプロジェクトをご紹介いたします。

まず最初がこのVIIMプロジェクトです。このVIIMプロジェクトはさまざまなオペレーション業務におけるデータを集約すること。それとそれらのデータを可視化すること。これをまず活性させることになります。その上でデータの元から業務改善および意思決定できるような環境、それを構築していく。そういったことをゴールとしてこのプロジェクトをスタートしています。

このプロジェクトはLINE Fukuoka全体に関わるものです。そのため組織横断的なプロジェクト体制が必ず必要となります。そのためこのプロジェクトからはさまざまな部署、チームからメンバーを集め、そして進めています。例えばPM/PdM、あるいはダッシュボードの構築といったところではDigital Planningチーム。全体的なシステム構築といったところはWork Improvementチーム。

データ独特な部分、あるいはそれに関するアプリケーション開発というところはGlobal Operationチーム。そしてデータのパイプライン、あるいは分析といったそういったところについては私たちData Analysisチームが担っています。

ではこのシステムの基本的なアーキテクチャについて、こちら画面に示している通りです。まずさまざまな入力ソースからAPIおよび開発したアプリケーションでData Lakeへと集約させていきます。そして集めましたそのデータを加工して分析の時に使いやすいようData Ware Houseへ流し込むということを行います。

そしてそのData Ware HouseからTableauといったBiツールおよび他の分析プロダクトへと現在展開させています。このメインとなります中央のデータフローについては現在はAirflowを用いて管理・運用していますし、これらはいろいろ変更とかに対応できるようにスケーラブルに拡張できることを意識して現在構築されています。

実際の成果

じゃあ実際に成果としてどういうものになるかというと、こちらになります。具体的にこちらのダッシュボードですね。これらが実際に必要な部署の、そして必要なメンバーに権限を管理されたもので、すぐに見れるようにこのような準備がされています。

もちろん、このプロジェクトは現在進行形で進んでいますが、現時点ですでに3つの大きな達成が得られています。1つは、まず何よりもデータの集約ですね。データを集約し、KPI指標を単一のプラットフォームで可視化する。それぞれの部署で、独立ではなく単一のプラットフォームで集約して可視化できるようにしています。

そして何より、従来これらの業務は現場での作業でした。ところが集約することにより、現場でレポート作成といったオペレーションコストを削減できたということで、十分な成果と評価を得ています。

次に、プロダクトを紹介いたします。予測一元化プロジェクトです。このプロジェクトでは、データサイエンスの技術を適用することで、業務量に影響するような指標、オペレーションに関係してくるような指標の精度を担保した上で予測する、統一的なフレームワークを構築することを目指して現在進めています。

このシステムは現在運用していますが、まずバッチ処理を行うところのアーキテクチャを簡単に紹介します。入力のデータソースにアクセスして、そのデータを必要なかたちに加工する。そしてDeepARやprophetなど、最新のライブラリを活用しながら学習を行い、最適の結果をファイル形式およびダッシュボードにして、出力しています。

現在このバッチ処理については、Airflowを用いて管理し、また必要に応じて調整、チューニングできるように構築を進めています。また今回のこの予測システムの特徴として、先ほど紹介したバッチシステムだけではなく、ユーザーがその場で予測ができるように、オンラインで時系列予測をするものも提供しています。

こちらは左の図にある通り、アクセスしたら時系列に必要なデータおよびイベントのデータのファイルをアップロードします。各種設定を行うだけで、右側にあるような予測結果とダウンロードファイルが自動的に生成されて、リアルタイムにすぐ必要なものが、その場で取得できるようになっています。

このプロジェクトも、もちろん現在進行形ですが、精度の高い予測結果を提供できるようになっています。また、フレキシブルに対応できるように設定していますし、何よりオンラインとバッチ、この両方のシステムを提供することで、よりスムーズな予測を、さらに活かせるかたちで提供できています。

今後の方向性

それでは、今後の方向性についてです。やはり、真のデータドリブンに向けて邁進するためには、以下の3つが必要になってくると考えています。

まずは、データマネジメントです。まだデータを集約している段階ですので、今後活用していくためにはマネジメント体制を構築することが必要不可欠です。現在構築を進めています。

次に時系列予測における統合的なフレームワークです。先ほど紹介したシステムより汎用なかたちで、より統合的に提供できる、スムーズにリリースできるものを構築中です。

また機械学習。これをもっとオペレーションに組み込んでいきたいと思っています。来年成果を伸ばしてこれらの成果を報告できるよう、これからも進めていきたいと思います。

以上で発表を終わります。ありがとうございました。