機械学習の重要なインサイト

ジョン・ヘネシー氏:ここからは機械学習の基礎として知っておいてほしいことを、8分間でお話しします。機械学習の重要なインサイトは何か。それは「人工ニューラルネットワーク」の構築です。

未熟な人間の脳のようなものと考えていいでしょう。脳はニューロンを持ち、すべてが複雑につながっています。だいたいのイメージはこのようなものです。ただしまったく同じとは言えません。

コンピューターで構築されたものより、脳はずっと効率的です。とはいえインプットに階層がある点においては似ています。

迷惑メールフィルターを使っている場合は、メッセージの送信者と宛先や返信先を確認します。件名や本文も確認します。出力も多数あります。メッセージの重要性や優先度、フィッシングメールか、プロモーションかどうかなどです。

また層の間には隠れ層と呼ばれる層があります。潜在的に多数の層を持つため、ディープニューラルネットワークと呼ばれます。これらが層の間にある隠れ層です。ここではメッセージを受信した際に、重要ファイルか、それとも迷惑メールファイルか判定を行います。分類すべきカテゴリを判定することは、分類の典型的な課題となります。

これらの隠れ層の内部はどうなっているかといえば、非常にシンプルです。

層と層の間のカッコは重み付けを示しています。つまり乗算する値です。入力をすべて合計して特定のノードを構成します。ノードはすべての入力に重み付けを乗算した合計値です。

まさにこれだけの話です、非常にシンプルです。人間のニューロンもシンプルです。単純に足し算していけば、最後に結果として数値が出てくるのです。迷惑メールの場合、その数値が重要なメールである確率より高くなるはずです。これがニューラルネットワークです。このレベルでは非常に単純ですが、これを拡張する段階において大きな力を発揮します。

これらニューラルネットワークの典型的な課題とは、訓練が必要だということです。重み付けの一つひとつについて設定方法を考えなくてはなりません。その最も一般的な方法が、教師あり学習と言われるものです。

これを実行するには、人間によって分類されたデータセットを取り込みます。迷惑メール、ソーシャルメディアやプロモーション、フィッシング詐欺かどうかの判定です。人間がすべての分類を行うのです。このデータはトレーニングセットと呼ばれ、ニューラルネットワークの訓練に使われます。このように重み付けを設定するのです。結果がこのセットと一致するようにしていくわけです。

ニューラルネットワークの予測の精度を上げる「教師あり学習」

注意したい点があります。ニューラルネットワークは訓練データがあってこそ成り立つものです。決して賢い機械ではありません。一般常識を持たず、信ぴょう性も判断できません。誤った情報で訓練すれば、誤った予測を行います。

ですから訓練が重要なのです。質の悪い訓練データの取得も厄介な問題の1つです。トレーニングセットの範囲外となる特定のインスタンスを取得できますが、ニューラルネットワークはうまく対応できません。

では、どのように重み付けをするのか。誤差逆伝播法と呼ばれるアルゴリズムを用います。基本的にこのトレーニングセットを用意します。メッセージをマークして、これらの入力を後ろ向きに実行する方法です。まず重み付けを設定し、トレーニングセットのすべての要素に対し正しい答えが得られるようにするのです。

この訓練のステップでは、ニューラルネットワークを使って非常に多くの演算を行います。ここに長い時間がかかるわけです。時間もかかるし、非常に複雑な計算です。トレーニングセットのすべての要素に対しこれを実行し、結果が安定する収束の段階まで継続します。

訓練が終わると推論の段階に移ります。

初めて見るメッセージを使います。これを入力するとメッセージが分類されます。迷惑メールかどうか、重要性はあるか、ソーシャルメディアかなどを判断するわけです。

重要なのは、しっかりと訓練すれば予測の精度が上がるということです。これがニューラルネットワークの教師あり学習です。

迷惑メールの検出においてはどうでしょう。その闘いは今も続いています。ハッカーはユーザーのアカウントに侵入する方法やパスワードを窃取する方法、不正アクセスによって情報を流出させる方法を絶えず探っています。そのため常に新しいデータを追加して、これらのメッセージをフィルタリングする必要があります。こうしてニューラルネットワークを再度訓練するのです。

ハッカーが大量のメッセージを送信した場合、多くの人がオンラインでそれを迷惑メールと判定します。これを迷惑メールとマーキングし、トレーニングセットに追加します。そしてモデルを再度更新します。これでより新しいデータで予測を向上できます。

基本的にクラウドソーシングによく似ています。迷惑メールを検出するため、すべてのユーザーからあらゆる情報を収集します。迷惑メールかどうかは人間が判定し、ニューラルネットワークが認識できるよう訓練します。そのため常にデータを改善する必要があるのです。そうでなければハッカーは迷惑メールフィルターをかいくぐり、システムに侵入してアカウントの窃取などを働くのです。

レコメンデーションシステムの仕組み

データ主導型に起因する興味深い問題をもう1つご紹介しましょう。レコメンデーションシステムの構築に関する問題です。わかりやすい例を挙げてみましょう。

例えばNetflixなどストリーミングサービスで、次に観る映画やTV番組を勧めてくれるレコメンデーションシステムなどがあります。視聴履歴を基に、次は何を観たらよいのかと。

このシステムを、一般的なやり取りを通じて方向性を提案するものとして捉え直してみましょう。

ここで顧客からのリクエストを受ける、インターフェイスとなるシステムについて考えてみましょう。顧客が電話をすると「~でない場合は1を押してください」といった自動案内が何度も繰り返されることがあります。

これはあまり良くありません。問題が複雑だと厄介になります。30分も自動案内で堂々巡りしてしまうと、やはり人と話したほうがよいと考えます。もっと早く対応できていたはずです。

そこでレコメンデーションシステムを使い、ユーザーとやり取りを行います。Amazonなどもレコメンデーションシステムを導入し、動画や商品の分類を行っています。過去の購入履歴や類似したユーザーの行動を基におすすめを提案します。

どのようにやっているのでしょうか。あなたと同じ商品を購入した別のユーザーを探します。そしてそのユーザーが購入する別の商品を確認し、あなたのおすすめ内容に反映するという仕組みです。

ユーザーが商品を検索しているという条件でフィルタリングして検索をかけます。ユーザーがある製品を検索すると、システムは類似ユーザーの好みを基に表示する内容を決定します。

限られた数の映画を基に、次に観るべき映画を推論するには?

こうしたレコメンデーションシステムは、対ユーザーコミュニケーション全般において多くの用途をもたらします。またその重要性は増す一方です。

しかし、レコメンデーションシステムには演算に関わる困難な問題があります。世界中に何本の映画があるでしょうか。Netflixで配信される映画は全部で何十万本にもなります。私は1,000本ほど観てきましたが、それを基に数十万本の映画を演算することなど不可能です。なぜなら演算は膨大な量になるからです。

そこで、このようなレコメンデーションシステムの管理をどのように行うかが問題となります。限られた数の映画を基に、次に観るべき映画を推論するにはどうすればよいでしょうか。効率よく答えを導き出すには特別な演算能力が必要です。

この演算モデルを迅速に更新していくことも問題です。急ぎの対応が必要な要素があります。例えばワールドカップが開催間近であるとします。「アルゼンチン対スペイン」とユーザーが入力する時、何が求められているのでしょうか。

両国が何かで対立している情報を知りたいわけではなく、ワールドカップの試合の日時を知りたいのではないでしょうか。オリンピックも同様です。オリンピックについて質問される可能性がある内容を、なんとかしてシステムに取り込んでいく必要があります。

こうしたレコメンデーションシステムでは、常に変化するデータを活用できるようにプログラミングしています。世界的なイベントがある場合や、Netflixで配信される新番組が反響を呼びそうな場合に変化が生じるかもしれません。『ホワイト・ロータス』のような番組が突如リストの一番上に現れるわけです。

理解しておくべき大切なポイントは、データ主導型のシステムはこうした要素に対し動的で、応答性に優れているべきだということです。これらを把握し優れたレコメンド機能を実現するには、常に最新のデータが必要です。

物事の変化に合わせて最新の流行を常にフィルタリングする必要があります。こうした分野は今まさに始まったところです。さまざまな用途に活用されていることに加え、生成AIというすばらしい動きもあります。

データ主導型の思考法を管理・浸透させるポイント

ここからのスライドでは、データ主導型の思考法を企業内でいかに管理し浸透させていくのか、あらゆる場面でこの意識を持つにはどうすべきかお話ししていきます。

いくつか例を挙げましょう。1つ目はA/Bテストです。

これは非常にシンプルなテストです。異なる選択肢を異なる対象者に提示して、どのような結果となるかを確認します。選択肢はAかBのパターンだけでなく、3パターン以上の場合もあります。

はっきりと予測できないことも多いため、実際に試してみるというわけです。どのパターンが良いかをあらかじめ把握する方法など存在しないからです。潜在顧客である対象者をグループ分けして、A~Dのパターンをそれぞれ提示します。その中で評価が高かったものを採用するという方法です。

実際の活用例をご紹介しましょう。どれくらいの広告数を表示するべきか、それに対し実験を行いました。広告や検索結果にどのような色を用いるべきか、色を変更することで違いが発生するのか、フォントを変更するのかなどです。

そんな些細なことで大きな影響が生じるはずはないとみなさんは考えるかもしれませんが、大規模なビジネスなら0.1パーセントが大きな違いを生み出します。ですから常にこのテストを行うのです。

検索結果の分割や新しいユーザーインターフェース、Gmailのデザインに対してさえもです。Gmailを開いた時の画面構成がどんなものか、それをテストするのです。2つのパターンをユーザーに試してもらい、どちらを好むか確認します。

ほかの項目も測定可能です。Gmailであればメッセージ間をどれくらい迅速に切り替えられるかを測定したり、返信や転送などにかかる時間を測定したりします。そしてユーザーの操作の実態に基づき、これらを最適化することができるのです。

結果が出るまでの時間やクリック数などの、ユーザーの操作を測定することができます。ではなぜ測定が必要なのでしょうか。

それはインターネットの世界ではユーザーの満足度が非常に重要だからです。応答性やユーザーの満足度を高めることが真の差異化要因となります。ユーザーの関心は、正しい答えをできるだけ早く入手できるかどうかにあります。常に測定し品質を高めることが、企業にとっては非常に重要なのです。

目標管理ツール「OKR」の価値

ここでもう1つ重要なのは、Googleが長年使ってきた主要な目標管理ツールで、「目標と主要な結果」を称したOKRと呼ばれるものです。ツールの起源はアンディ・グローブがIntelを経営していた頃にさかのぼります。Googleは時間をかけてこれに手を加えてきました。

私たちはまず目標を掲げます。その目標は、会社が向かう大きく壮大なビジョンです。「ワールドワイドウェブ(WWW)でトップクラスの情報のオーガナイザーになる」「ソーシャルメディアのリーダーになる」「世界一の電気自動車メーカーになる」などの、企業が目指す大きな目標です。チームを結束させる力となり、全社員に会社の方向性を示します。

次に「主要な結果」です。これは先ほどの目標を支える測定可能な指標です。測定は直接行います。これを用いて社内の各部署が業務に注力できるように促します。

Googleの主要な結果の例をご紹介しましょう。

私たちは四半期ごとに基準を設け、検索による増収を目指していました。大幅な増収を目標としたのです。その基準をさらに細かく分けて、検索による収益の決定要因を分析する必要がありました。この検索収益とは、検索数の合計に検索ごとの収益を掛け算した値です。

すぐ着手できる増収施策もあります。つまり、検索数の増加に向けての取り組みです。まず思いつくのは、WWWやGoogleのユーザーを増やすための取り組みなどです。検索ごとの収益を増やしてもいいですし、それぞれ少しずつ取り組むこともできます。

検索ごとの収益を増やすには、検索数の合計値を確認します。これは「1日の平均利用者数 × ユーザー1人あたりの利用時間 × 1時間あたりの検索数」で算出します。同時に検索ごとの収益は「クリックスルー率 × 検索ごとの広告表示数」で算出します。このような方法論で考えてみることで、ロードマップを作成できるようになります。

担当するチームごとの目標設定

検索による収益を10パーセント増やしたい場合、検索数を増やすことと検索ごとの収益を増やすことで、それぞれいくら増収益となるかを考えます。次に合計検索数を細分化します。これには3つの要素があります。

それぞれを担当するチームについて目標を設定します。1つ目はユーザー増加に取り組むチーム、2つ目はユーザーの利用を維持するチーム、最後にユーザーの検索頻度担当のチーム。これらのチームにそれぞれ目標を割り当てます。これにより主要な結果を達成する見込みを合理的に設定することが可能です。

ただし注意してください、見込みを100パーセントにはしません。それでは目標が低くなってしまいます。背伸びをした目標ではあるけれど、十分に実現可能なものとすることで、達成感を味わえるようにします。

このような方法ですべての要素を組み込んでいます。これらすべてを測定し組み立て、そして目標を設定します。常にすべてを正しく見通すことはできないものなので、100パーセント完全に予測することはできません。ある要素が別の要素よりも成長することもあります。とはいえ個々のチームに目標を示す秩序立った方法論であることに変わりありません。