LINEのプラットフォームを通じてユーザーとあらゆるサービスをつなぐ

朴イビン氏(以下、朴):Welcome! LINEのCTO、朴イビンです。みなさん、LINE DEVELOPER DAYへようこそ。今年もまたみなさんとお会いできて、本当にうれしいです。

LINE DEVELOPER DAYは今年で5回目になりました。エンジニアのみなさんにたくさんのお土産を持って帰ってもらえるように、今年の2日間でよりたくさんのコンテンツを準備しましたので、みなさん、ぜひ楽しい時間をお過ごしください。

LINEはみなさんの生活の中のあらゆるシーンをサポートしていくことを目指しています。そのため、LINEのプラットフォームを通じていろいろなサービスを繋ごうとしていますし、それをAIを通じてより自然なかたちで経験してもらおうとしています。

またLINEは、みなさんが必要とするさまざまなサービスの開発を続けていて、現在では約70サービスが運営されていますし、今年だけで約20サービス以上をローンチしました。

その中で、昨年から開発しているサービスを見てみましょう。いろいろな金融サービスの書類やハンコの手続きなど、お金に関係するサービスを使うのはとても複雑で手間がかかります。それをみなさんがオンライン上で簡単に利用できるように準備をして、今年、「LINEほけん」「LINE証券」など、さまざまなサービスをローンチしました。

また、9月には新たに日本向けの仮想通貨取引サービス「BITMAX」をオープンしました。また、すでに発表がありましたけれども、日本・台湾・インドネシアで新たな銀行サービスを各国のパートナーと共同で準備しています。

経済活動の基盤になっているモバイル送金・決済サービス「LINE Pay」も成長を続けてきました。日本の登録ユーザー数が約3,700万人、グローバルでは約5,000万人の規模になっています。

いろいろなペイメントサービスが存在していますが、このLINE Payの特長としては、国内で一度LINE Payを利用したユーザーがまた利用するリテンション率が75パーセントで、非常に高いということです。また、日本国内やグローバルなどいろいろなパートナーとアライアンスを結びながら、キャッシュレス社会の推進を一緒にリードしていきたいと考えています。

今年は、ほかの分野でもさまざまなサービスをオープンしながら、新しいエリアへの挑戦を続けてきました。中東では今年「Sway」という動画チャットサービスをオープンしましたし、ベトナムではコマースサービスに挑戦をしているところです。

さらに、LINEのサービスだけではなく、エンジニアのみなさんが開発しているサービスとLINEのユーザーをつなぐために、LINEはMessaging APIをはじめ、開発者向けのプラットフォームも進化させてきました。

その中の1つ、「LINE MINI App」をご紹介します。LINE MINI Appは、みなさんのサービスをそのままLINE上で使えるようにする、パブリッシングプラットフォームです。

たとえば、ある飲食店が予約機能を持つLINE MINI Appをパブリッシングすれば、LINEユーザーはLINE上でそのサービスを検索し、ホームタブでブックマークをして素早くアクセスすることも可能です。

そして、LINE上でその飲食店のサービス画面を開いて、予約をしたり、途中で画面自体を最小化して友だちとチャットをしてから、再び開いてまた利用することもできますし、予約した内容をそのままLINEで友だちに簡単に送れます。

また、予約において一番大事である通知に関しては、予約が完了したタイミングや、「そろそろ予約時間だよ」というように、LINEからみなさんへの通知をすることが可能です。ユーザーは新たなアプリをインストールすることなくサービスを素早く簡単に利用できますし、お店としてもLINEを通じて自分のサービスのリテンション率を高めることができます。

データハンドリング保護のための2つのプリンシプル

:今の世界はたくさんのサービスやデータが溢れています。そのため、もっとシンプルに必要なサービスをより自然に提供する技術としてAIが私たちのまわりに常に存在している、そういう時代になっています。

LINEもAIとともに進化しています。音声でみなさんの質問に答えたり、クレジットカードなどを認識したりすることで、サービスを利用するみなさんをサポートしています。その他にも、みなさんが聞きたい音楽・読みたいマンガ・動画・ニュースをみなさんの好みを把握してレコメンドしてくれるなど、みなさんがLINEのサービスを利用しているあらゆるシーンで、AIが存在しています。

このAIテクノロジーを成長させるためには、さまざまなサービス・コンテンツから得られる膨大なデータをうまくハンドリングする必要があります。そこで、LINEがデータハンドリングにおいて必ず守ろうとしている2つのプリンシプルを紹介します。

1番目は「Privacy First」。当たり前の話なんですが、プライバシー保護のためのセキュリティ構築は、すべてのコストや機能より優先されるべきだと考えています。

LINEのデータプラットフォーム規模はグローバルサービスの中でもトップクラスの規模です。それだけデータプラットフォームが大きく複雑ですので、その分「Privacy First」という原則を軸にして、すべてのシステムやプロセスがデザインされるべきだと考えております。

2番目は、データサイロをなくすことです。各サービスがそれぞれ独立したシステムでデータをバラバラに管理しますと、コストは高くなりますし、データをまたいでインサイトを探すクロスマシンラーニングは難しくなります。

また、別々のシステムになると、データ保存やプライバシー保護におけるリスクはもっと高くなる恐れもあります。ですので、このデータ間の隔たりを最大限になくすのが、LINEの2番目のプリンシプルです。

この2つのプリンシプルを実現するために必要なのが、異なるサービスを1つのデータ環境で運営するためのプラットフォーム、Unified Self-Service Data Platformです。このデータプラットフォームを通じて、その上でデータガバナンスを利かせながら、ユーザーにとってはもっと安全に、AIにとってはより効率的にデータを活用する環境を作っています。

それでは、このKeynoteでAIをサポートするData Platform & Infrastructureの視点、そしてSecurity & Privacyな視点を、それぞれの担当から直接話してもらいましょう。

まず、AIに関して、砂金さんからお話しいたします。みなさん、拍手でお願いします。ありがとうございます。

(会場拍手)

ユーザー個々の嗜好に合わせる「Smart Channel」

砂金信一郎氏:みなさん、おはようございます。LINE BRAIN事業 責任者の砂金でございます。

イビンさんからのお話にあったとおり、LINEが提供するサービスでは、AIを積極的に活用し、より自然なユーザー体験を実現しています。ここではその取り組みの一部をデモを交えてご紹介をしていきたいと思っております。

「Smart Channel」という機能をご存じでしょうか? 意識的に使っていない方々もいらっしゃるかもしれませんが、多くの方々が目にしているはずです。トークリストの一番上、LINEの提供するサービスの中で一番使用率の高い一丁目一番地に、みなさまのお役に立つよう、この画面のような、天気や災害情報・嗜好に合わせた広告などをパーソナライズしたかたちで提供しています。

この仕組みをどのように実現しているか、裏側をごく簡単にご説明をしたいと思います。

LINEのメッセンジャーや「LINE NEWS」「LINEマンガ」など多くのサービスのログ・コンテンツは、全社横断で一元管理をしています。サービスの数や規模を考えると、これだけでもすごいことではないかと思います。

そして、これらの全体データの中から、ユーザー行動とコンテンツに着目をして、それぞれの特徴量を抽出し、そのあとの分析を行いやすくしています。

ユーザー行動の特徴を表すUser Featureの中には2,000万次元の膨大なデータが含まれています。この中には、例えばみなさんがどのようなLINE公式アカウントを友だちとして登録をしているのか、そういった情報もすべて含まれています。

この特徴量をもとに、レコメンデーションや属性推定など基本的なマシンラーニングの仕組みをあらかじめ用意しておくことで、各サービスでAIの技術を組み込みやすくしています。これらのプロセスを経て、ユーザーに合わせた推論結果がSmart Channelに表示されています。

この仕組みを実現する難しさは、個別最適で事業を推進しようとする各サービスのデータ統合にあります。

そしてLINEは、データだけではなくて、データサイエンティストもまた1つの組織に統合しています。その結果、専門性の高い同僚同士で切磋琢磨しながら、好きなツールを使って実環境の大量のデータを分析する。これはデータサイエンティストにとっては非常に良い環境を提供できているのではないかと考えています。

Smart Channelを支えるレコメンデーションの仕組みだけではなく、検索やモニタリング、自然言語処理など、多くのAI技術を活用して、Natural Experienceを実現してきました。

AIプロダクト「LINE BRAIN」の仕組み

砂金:データのプライバシーを守る観点から、LINEの社内の仕組みをそのまま外部に提供することは非常に難しいのですが、その中から機械学習を応用した仕組みのいくつかをAIプロダクトとしてみなさまにご提供しようとしています。それがLINE BRAINです。

LINE BRAINは、主にClovaを構成するために必要となった自然言語処理や音声関連の技術を中心に構成されています。日本語を含むアジア系の言語や各国の文化に根ざした行動データ分析、End-to-Endでのカスタマイズなどを用いて、競合との差別化を図ろうと考えています。

本日はこの中からとくにVision関連を中心に、いくつかご紹介をしていきたいと思います。

一部の方には本日受付で顔認証を利用していただきました。反応速度も比較的良く、良いユーザー体験になったかなと思います。開始が遅れたのでちょっとドキドキしてましたが。

(会場笑)

実際に写真の登録をしていただいて、今回申し込みの方々2,000名ぐらいいらっしゃるのですが、その方々をn対nでマッチングをする技術を実現しています。アジア人の学習データが比較的多いので、誤認識の確率も低いのではないかなと思っています。

今回は簡易的にiPadの顔認証の仕組みをアプリを通じて使いましたが、サイネージ端末などへの組み込みやスマホを使ったeKYC、本人確認など、こういった顔認証の仕組みはいろいろなところに応用が利くのではないかなと思っております。

LINEならではのカジュアルなアプローチでみなさんからデータを集め、より精度の高いAIを実現していこうと考えているところです。

続いて、同じくVision系の中で、OCR(文字認識)についてご説明をしたいと思います。OCR自体は古くからある技術ですが、近年、AI技術の発展により再び注目をされているエリアの技術です。

我々の研究開発チームは「ICDAR」の国際カンファレンスにおいて、ほかの参加チームを大きく引き離す成績をあげることができました。その勝因は何だったと思いますか?

AIにはアルゴリズムとデータが必要だとされています。我々はこのような高い精度が実現されている背景には、学習データ自体を自動的に生成するData Augmentationという手法がうまく使われて、その成果がこちらにつながっていると言えると思います。

手書き文字データ収集の試み

砂金:日本を含むアジア圏でニーズの高い手書き文字認識の認識精度をより一層高めるためには、大量の意味づけされた学習用の手書き文字データが必要となります。

ここで、手書き文字関連ということで、少し前に日本のネットで話題になった大学生の田村さんの取り組みをご紹介したいと思います。

2019年になっても手書きのレポートを要求される大学での授業へのあてつけで、手書きノートと自分で部品から作ったプロッターを用いて手書き風のレポートを大学に提出したことが話題となって、テレビや各種メディアに取り上げられているちょっとした有名人です。

このときの取り組みでは、レポートに出てくるすべての文字を手書きでフォント化していましたが、日本語はひらがな、カタカナ、日常的に利用するものだけでも数千字に及ぶ漢字データすべてをフォントとして作成する必要があり、多くの労力とコストがかかってしまいます。

もしこの田村さんに我々が手書きフォント生成技術を通じて彼自身の手書きのフォントを提供できたらどうなるかと、彼にお声がけをして協力を仰ぎ、我々が用意した学習用のテンプレートに彼の文字を書いてもらいました。そこからAIで自動生成されたのがこちらの図です。

いかがでしょう。パッと見、どちらかが自動生成されたフォントか判断できるでしょうか? 左側がオリジナルの手書きフォント、右側がAIで生成されたフォントです。ご自身の文字の特徴が非常によく現れているのではないかと思います。

このフォント生成にはGAN(Generative Adversarial Network)という技術を応用することで実現をしています。私も試してみましたが、漢字ドリルのような指定のフォーマットに500文字ぐらい記入していただくと、AIが私専用のフォントを作ってくれる、そういうことが実現できるようになっています。

……とお話ししている間に、なんとこちらにデモ環境がセットアップされていますので、実際に彼が組み立てたプロッターで、7,000円ぐらいで作ったらしいんですけど、文字を出力してみたいと思います。

(プロッターが)動き出しましたね。カメラも動けるでしょうか。一生懸命このプロッターが出力してますね。このペンプロッターの出力には書き順を含むストロークフォントが必要になってくるのですが、その生成も今回はチャレンジしています。

そして、今日はこのプロッターの仕組みを作られた田村さんに会場にお越しいただいています。今回生成したフォントは田村さんにプレゼントしたいと思いますので、これで手書きのレポート地獄からは解放されて、有意義な大学生活を送っていただきたいなと思っております。みなさん拍手お願いします。

(会場拍手)

ありがとうございます。このGANで生成したフォント生成技術自体も非常にユニークですばらしいものなのですが、みなさんに注目していただきたい点は、この生成技術だけではなくて、認識技術を高めるためにデータを自動生成できる、この点に注目していただきたい。

今回はOCRという観点でご説明しましたが、さまざまなAIにおける認識技術の精度を高めるために、我々はデータ生成やそれを用いたテスト、こういうところの自動化をして、より高度なAIを実現させていこうと考えています。

LINEの自然言語処理はどこまで進化したか

砂金:次に、みなさんのコミュニケーションを支えているLINEにもう少し近い存在である自然言語処理について、我々の進捗をお伝えしたいと思います。

2016年、LINE DEVELOPER DAYのキーノートでMessaging APIを公開させていただいて、そのあとサードパーティのみなさんに多くのBotを作っていただいたと。そして、翌年2017年にはClovaの自然言語処理技術を発表し、我々の自然言語処理がどういうレベルに至っているかをご理解いただきました。

そして、今年の6月にLINE CONFERENCEで「Project DUET」を発表させていただきました。その当時は非常にプロトタイプの中のプロトタイプで、緊張感あふれるデモンストレーションを展開していたのですが、Project DUET自体はレストランの予約が可能な特化型AIとして進化をしています。

電話回線経由の音声を適切に認識して、自然なユーザー体験を実現するための音声合成技術と、予約完了のために必要な情報を聞き出すまで諦めない対話生成技術を組み合わせて実現をしています。

我々の研究のための研究ではなく、世の中の役に立つより自然な体験を生み出すAIを生み出したいと考えているので、シンプルな機能であっても、きちんとユーザーの役に立つものを作ることのほうが重要であると考えています。

そして、本日11月20日より、実際の店舗、「俺のGrill & Bakery」大手町店にて、まだ限定的ではありますが、AIによる自動受付を開始することができました。

そして、サービス開始とともに製品名を「LINE AiCall」と変更しています。ただし、まだ性能改善中の実証実験段階であり、まずは携帯電話でなく固定電話からのみのスタートとさせていただいています。

AIとの会話を実際に試してみたい方はお店に電話をして予約を取っていただければと思うのですが、これはデモ環境ではなくて、本当にお店に予約が取れてしまいます。ですので、実際に予約をされた方は、No Showとか冷やかしではなく、お店に行っていただいて、この写真のようなおいしいお肉を召し上がっていただけるとよろしいかなと思っています。03-6262-5146 ですのでぜひお試しください。

この我々が磨き上げている音声認識技術はスマートスピーカーのClovaや今回ご説明したLINE AiCallだけでなく、ほかのところにもいろいろ応用が利くと考えています。

例えば、これはまだ研究開発中の動画解析ツールなのですが、試しに昨年のLINE DEVELOPER DAYのオープニングセッションの動画を読み込ませてみました。映像に映っている人物や話している言葉を認識して、いつ・誰が・どういうテーマを話していたのか、そのパートに簡単に飛ぶことができるようになっています。

先ほどご紹介したとおり、2016年はBot、2017年はClovaだったのですが、2018年はこの那須さんという人がブロックチェーンの話をしたんですね。音声認識により読み取ったテキストをキャプションとしてつけ加えていますが、現時点での認識精度だと、たまに間違えます。例えば「LINK Chain」が「人気店」になるんですね。

この技術は「LINE LIVE」のような動画コンテンツの価値向上や監視・運用などにも応用ができます。もしかすると、次回のLINE DEVELOPER DAYでは、すべてのセッションにおいて文字のキャプションがついて、AIによる翻訳がついた状態でみなさんにお届けできるのかということに我々もチャレンジをしておりますので、期待してお待ちいただければと思います。

LINEにおけるAIプロダクトの全体像

砂金:いかがでしたでしょうか? 今までご覧いただいた、動画解析、電話での自動応答、OCR技術と、それを実現するためのData Augmentationの仕組み、あとは受付で体験いただいた顔認証など、我々がみなさんにご提供予定のAI技術について一部をご紹介させていただきました。

そして、私のパートの冒頭でお話しした、LINEにおける全社横断でのデータ解析やマシンラーニングの仕組みを含め、LINEのAIに関する取り組みの全体像を把握していただけたのではないかと思います。

大量のデータを集めて、プライバシーを考慮して適切に管理した上でAIが学習可能な状態にするのは大変なことなのですが、逃げずに対応することで、LINEのサービスの改善やみなさまの役に立つAIの提供につなげていきたいと考えています。

そして私のパートの最後に、本日会場にご参加いただいているみなさまにプレゼントございます。途中でご紹介したAI-OCRのAPIを、ご来場されたみなさまにかぎり無償にて先行提供させていただきたいと思います。

期間限定、また開発用途限定とはなりますが、この環境を実現するにあたっては、我々が日頃より大変お世話になっていますNVIDIA様より最新のGPU T4をご提供いただいております。みなさま、NVIDIA様への感謝の拍手をお願いいたします。

(会場拍手)

具体的な利用手順などは会場内で追ってご説明があると思いますので、楽しみにしていてください。ただ、大変申し訳ないことに、今回は日本語・韓国語・英語での対応となりますので、タイ、台湾、インドネシア、それ以外の国から来られた方々におかれましては、その点をご了承いただければと思います。

みなさんが開発しているアプリやサービスの中にAI-OCRを組み込んで、LINEが手掛けるAI技術の一端をぜひ体験してみていただければと思っております。

以上で、私のAIパートは終了となります。続いて、AIとみなさまのユーザー体験をつなぐデータプラットフォームとインフラについて、三枝さんにお話をいただきます。三枝さん、よろしくお願いします。

(会場拍手)