logmi・ログミー

世界をログする書き起こしメディア

「産業革命以上のインパクト」機械学習がもたらす未来と、失われていく仕事

「産業革命以上のインパクト」機械学習がもたらす未来と、失われていく仕事

近年急速に進歩し、将棋やチェスなどで人間を打ち負かすようになった人工知能。コンピューター自身が学習する機械学習の手法のひとつ、「ディープ・ラーニング」により、加速度的に進化を続けています。GoogleやAmazonなどでも使われているディープ・ラーニングの可能性と、それが我々の仕事にもたらすであろう変化を専門家が語ります。(TEDxBrusselsより)

スピーカー
データ・サイエンティスト Jeremy Howard(ジェレミー・ハワード) 氏
参照動画
The wonderful and terrifying implications of computers that can learn

機械学習の父、アーサー・サミュエル

ジェレミー・ハワード氏(以下、ジェレミー) かつてはコンピュータに新しいことをさせたければ、それをプログラミングしなければなりませんでした。ここにいるみなさんは、プログラミングをやったことはないかもしれませんが、コンピュータを使って目的を達成するには一つひとつの段階を事細かに指定しなければなりません。もし自分でもやり方がわからないことをやろうと思ったら、大変な作業になるでしょう。 それがこのアーサー・サミュエルが直面した問題でした。 1956年のことです。彼はチェッカーで自分に勝てるコンピュータを作ろうとしました。しかしどうすれば自分よりもチェッカーの強いプログラムを書き、ひどく細かい部分まで指定することができるのでしょうか? 彼はあることを思いつきました。コンピュータに自身と何千回もチェッカーの対局をさせ、学ばせるのです。これは上手くいきました。実際に、1962年にコネチカット州チャンピオンを倒したのです。 アーサー・サミュエルは機械学習の父です。私は機械学習の専門家なので、彼にかなり影響を受けています。私は20万人以上の機械学習専門家が集うコミュニティである、Kaggleの代表でした。 Kaggleは専門家らに未解決の問題を解かせるコンテストを開き、何百回も成功させてきました。そのような立場から、機械学習が過去にできたこと、現在できること、将来的にできるであろうことを学ぶことができました。

機械学習はいまや身近にあふれている

機械学習の最初の商業的な成功例は、Google(グーグル)でしょう。Googleはコンピュータアルゴリズムを使った情報検索が可能であることを示しました。このアルゴリズムは機械学習にもとづいています。 Google以降、機械学習の商業的な成功例が多く出ています。Amazon(アマゾン)やNetflix(ネットフリックス)は、機械学習を利用して消費者の好みにあった商品や映画を提案します。正確すぎて気味が悪いほどですね。 LinkedIn(リンクトイン)やFacebook(フェイスブック)は友人かもしれない人を教えてくれますが、いったいどうやっているのか検討もつきませんよね。これも機械学習の力を使っています。これらは手動でプログラムされたのではなく、アルゴリズムによって学習されたのです。 IBMのWatson(ワトソン)も同様のやり方によって、『ジェパディ!』(アメリカの人気クイズ番組)で2人の世界チャンピオンを破りました。このように信じられないほど複雑な問題にも答えていました。 自動運転車が実現したのも、機械学習のおかげです。たとえば、木と歩行者を見分けることができるかどうかは重要な問題です。こういったことをプログラムするのは難しいですが、機械学習ならば可能です。実際にこの車は、通常の道路を無事故で何万マイルも走っています。

ディープ・ラーニングの登場

さて、コンピュータは我々もやり方を知らないことさえ学習できるということがわかりましたね。もしかしたら我々よりも上手く学習できるかもしれません。 これからお話するのは、機械学習のもっとも驚くべき例のひとつです。私が主催したKaggleのプロジェクトで、トロント大のジェフリー・ヒントンのチームが薬を発見するコンテストで優勝したときのことです。 特筆すべきは、彼らが医薬大手のメルク社やその他の国際的な学術機関によって開発されたアルゴリズムを破ったことだけではありません。そのチームには誰も科学や生物学、生命科学のバックグラウンドをもった人がおらず、たったの2週間でやり遂げてしまったのです。 いったいどうやったのでしょう? 彼らはディープ・ラーニングという特別なアルゴリズムを用いました。この成功は、数週間後にニューヨーク・タイムズの一面で取り上げられるほど重大な出来事でした。 画面の左側に出ているのがジェフリー・ヒントンです。 ディープ・ラーニングは、人間の脳の動きから着想を得たアルゴリズムです。理論的には、できることに限界はありません。データと処理時間を与えれば与えるほど、より良い結果が得られます。 ニューヨーク・タイムズはこの記事で、ディープ・ラーニングに関するもうひとつの素晴らしい結果を報じました。これからお見せしましょう。コンピュータは「聞く」ことと、「理解する」ことができるのです。 (ビデオ)リチャード・ラシッド氏 このプロセスに最後に加えたいのは、実際に中国語を話させるということです。鍵となるのは、多くの中国人から大量のデータを得て、中国語の文章を中国語の音声に変換するシステムを構築した点です。そして1時間ほどの私の声データを使ってシステムを調整し、あたかも私が話しているかのようにしました。 もう一度言いますが、結果は完璧ではありません。実は多少のエラーもあります。 (中国語で音声が流れる) (拍手) この領域でなされるべきことはまだまだあります。 (中国語で音声が流れる) (拍手) ジェレミー 中国での機械学習会議の様子でした。学会で拍手が起きるなんてことはあまりないことです。もちろんTEDxでは時々ありますが。 みなさんにご覧いただいたのは、すべてディープ・ラーニングによるものです。英語による書き起こしや、中国語への翻訳、右上に出ていた文字、音声の合成もそうです。

機械学習で「見る」とはどういうことか

このようにディープ・ラーニングとは素晴らしいものです。ひとつのアルゴリズムで、何でもできるように思えてしまいます。1年前にディープ・ラーニングは「見る」こともできるということを発見しました。 ドイツ道路標識認識ベンチマークというよく分からないコンテストで、ディープ・ラーニングはこのような道路標識を認識することを学習しました。 他のどんなアルゴリズムよりもよく認識できただけでなく、スコアボードにあるとおり人間にも2倍ほど勝っていたのです。このように、人間に勝るコンピュータの最初の例が、2011年から出てきました。 このときから、様々なことが起こりました。2012年には、GoogleがYouTubeの動画を見るアルゴリズムを発表しました。1ヶ月に16,000台のコンピュータ上でデータを処理することで、ただ単に動画を見るだけで人間や猫などの概念をコンピュータが独自に学習するのです。 人は教えられて見たものは学びませんが、自分自身で考えたものを学習します。同じく2012年には、ジェフリー・ヒントンがとても有名なイメージネットのコンテストで優勝しました。これは150万の画像から、それらが何の写真かを判別するというものです。2014年には、画像識別エラーの確率は6%まで下がりました。これも人間より優れています。 このように機械は本当に素晴らしい働きをするようになっており、いまでは商業的に用いられています。たとえば、グーグルは昨年フランスのすべての場所を2時間で地図に記録したと発表しました。道路の画像をディープ・ラーニング・アルゴリズムに読み込ませて、番地を認識させたのです。以前はどれほどの時間と労力がかかっていたか、想像してみてください。

機械学習で「似た画像を検索する」

このような動きは中国でも起こっています。Baidu(バイドゥ)は、中国版グーグルのようなサービスです。 左上に見えるのが私がBaiduのディープ・ラーニング・システムにアップロードした画像の例です。その下には、その画像が何なのかシステムが理解し、類似画像を見つけているのがわかると思います。 似たような画像は似たような背景、顔の向きになっています。舌を出しているものもあります。Webページの文章を読んで見つけたものではありません。私がアップロードしたのは画像だけです。 つまりコンピュータは見たものを理解し、リアルタイムで何百万もある画像データベースを検索することができるのです。 コンピュータが「見る」ことができることには、どんな意味があるのでしょうか? いえ、「見る」だけではありません。ディープ・ラーニングはより多くのことを実現できます。 このように複雑で繊細なセンテンスも、いまではディープ・ラーニング・アルゴリズムによって理解可能です。これを見て分かるように、スタンフォード大のシステムですが、いちばん上にある赤い点がネガティブな感情を表す文を示しています。 ディープ・ラーニングの文章理解力はいまや人間の能力に近づいています。同じく、中国語を読むのにも使われますが、レベルはネイティブスピーカー並みです。このアルゴリズムは、中国語を使える人のいないスイスの人々によって開発されました。ディープラーニングは、ネイティブの人間の理解力にも劣らない世界最高のシステムなのです。

コンピューターは「書く」こともできる

これは私の会社で構築されたシステムで、これまでのすべてを組み合わせたものです。 これらの写真にテキストは紐付けされておらず、文を打つとリアルタイムでこれらの写真が何なのか理解し、入力した文章に近い写真を検索してくれます。 ご覧のように、私の文章とこれらの写真を理解しています。このように、文章を打つと写真を表示してくれるようなものはGoogleで見たことがあると思いますが、そこで実際に行われているのはテキストによるWebページの検索です。これはコンピュータがたった数カ月前に初めてできるようになったことです。 このように、コンピュータは「見る」だけではなく、「読む」ことも「聞く」こともできることがおわかりいただけたと思います。もはや驚かないかもしれませんが、コンピュータは「書く」こともできるということをお話します。 ここに昨日ディープ・ラーニング・システムを使って生成したテキストがあります。そしてこちらが、スタンフォード大のアルゴリズムが生成したテキストです。どちらもこれらの写真を表すために、ディープ・ラーニング・アルゴリズムを使って生成されたものです。 このアルゴリズムは、ギターを弾いている黒いシャツの男性を前に見たことはありません。男性を見たことはあり、黒いものも見たことがあり、ギターも見たことがあるのですが、このキャプションは新しく生成されたものです。まだ人間の能力には及ばないものの、近づいてきています。 テストでは、4回に1回はコンピュータによって生成されたキャプションが好ましいという結果が出ています。このシステムはまだ開発されてから2週間しか経っていませんが、来年には人間を上回るのではないかと思います。ゆえに、コンピュータは「書く」こともできると言えます。

機械学習があれば、経験がなくても医療の会社を立ち上げられる

これらをまとめると、非常におもしろい可能性が広がります。たとえば医療において。ボストンのチームは、がんの診断をするうえで役に立つ、何十という腫瘍の特徴を発見したと発表しました。同様にスタンフォード大のグループは、組織の拡大画像を見て、人間の病理学者よりもがん患者の生存率を正確に予測する機械学習システムを開発しました。 どちらのケースも予測が正確なだけでなく、新しい科学的洞察をもたらしています。放射線医学のケースでは、人間に理解できる新たな医学的指標となっています。 病理学のケースでは、診断をくだすためには、がん細胞自体と同じくらいその周りの細胞が重要だということをコンピュータシステムが発見しました。これは病理学者が数十年間教えられてきたことと正反対です。 どちらのケースでも、医療と機械学習の専門家の協働によってシステムが開発されました。しかし昨年には、それさえも乗り越えてしまいました。 これは顕微鏡で見た人間のがん細胞を識別する例です。このシステムは人間の病理学者と同じかそれ以上に、正確に識別することができます。しかし、実は医療のバックグラウンドがない人々が、ディープ・ラーニングを使って開発したものなのです。 同様に、これはニューロンの区分けです。機械は人間と同じくらい正確にニューロンを区分けすることができます。しかし、こちらも医療のバックグラウンドがない人々が、ディープ・ラーニングを使って開発したシステムなのです。 医療のバックグラウンドがなくとも、医療の会社を立ち上げるのはおかしなことではないと思い、私自身も起業することにしました。怖さはありましたが、これらのデータ分析技術を使うだけでも、有益な医療を提供することは可能であると理論は示しているように思いました。 ありがたいことに、メディアだけでなく、医療界からも素晴らしいフィードバックをいただいて、強く支持してもらっています。我々は医療の中間部分を受け持ち、出来る限りデータに置き換えて、医者には彼らがもっとも適した部分をやってもらうという方針です。

人とコンピューターの共同作業

ひとつ例を紹介します。新しい医療診断テストを生成するには約15分かかりますが、少し省いて3分にまとめたものをお見せします。医療診断テストよりもわかりやすい、車の診断テストをお見せしますね。 まず150万枚の車の画像を、撮影された角度ごとに分けます。画像はまったくラベリングされていないので、いちから始めたいと思います。ディープ・ラーニング・アルゴリズムを使って、構造領域を自動的に識別することができます。人間とコンピュータが一緒に働けるというのが、現代の良いところですね。 ご覧のように、人間はコンピュータに興味のある領域を伝え、それにもとづいてコンピュータがアルゴリズムを改良します。これらのディープ・ラーニング・システムは、実に16,000次元空間になっていて、その空間を通して軸を回転させ、新たな構造領域を見つけようとします。 それが成功したら、人間が興味のある領域を伝えます。コンピュータがうまくその領域を見つけることができました。たとえば、角度ですね。このプロセスを通して、探している構造の種類を徐々にコンピュータに伝えていきます。 これが病気の診断であれば、病理医が病的状態にある領域を診断したり、放射線医が潜在的に問題のある小結節を示したり、といったことを想像できるでしょう。 このケースでは少し複雑です。車の前と後ろはごちゃ混ぜになっています。なのでもう少し慎重に、手で前部から後部を選別しなければなりません。そしてコンピュータに、こんなグループに自分は興味があるのだと伝えるのです。

5〜6人で7年かけていた作業が、1人で15分に

こうやって続けていき、少し省きますが、機械学習アルゴリズム改善のために何百回も繰り返して学習させていきます。 ご覧のように、薄くなってきている写真は、どう理解すればいいかすでに認識されたものです。同様の写真の概念を使うことにより、この時点から車の前部だけを探すことができるのです。ここで、人間はコンピュータに「OK、おつかれさま」と言えるのですね。 もちろんこの段階でも、グループを分けるのは依然として難しいです。このケースでは、コンピュータにしばらく回転させた後でも、写真の左側と右側がごちゃ混ぜになっているものもありました。 ですので、コンピュータに再度ヒントを与え、ディープ・ラーニング・アルゴリズムを使って可能な限り左右を分離した投影像を見つけさせます。そのヒントを与えることで、OK、うまくいきました。分離させる方法をどうにか見つけることができました。 もうおわかりですね。これはコンピュータが人間に置き換えられるのではなく、協力していこうということです。これまでは5〜6人で7年かけてやっていたことを、1人で15分でやってしまおうと。 このプロセスには4〜5回の反復が必要です。150万の画像を62%の精度で分類することができました。そうなったら、大きなセクションを選んで、誤りがないか素早く確認できます。誤りがあった場合は、コンピュータに教えてあげます。それぞれのグループについて、このようなことを行うことで、150万の画像の分類を80%の精度まで上げることができました。 そうしたら、正しく分類されなかった少数のケースについて、その理由を考えます。このアプローチを使うことで、15分で97%の分類精度を得ることができました。 このような技術によって、世界的な医師不足などの大きな問題を解決することができます。世界経済フォーラムは、途上国では10倍から20倍の医師が不足しており、問題解決に必要な人材を育成するのには300年かかると発表しています。ディープ・ラーニングの手法を使って、医療の効率を上げ、手助けすることはできないでしょうか?

産業革命と同様に、機械学習で失われる職種とは

私はこの可能性にとても期待していますが、同時に懸念も抱いています。この地図の青いエリアは、雇用の80%以上がサービス業のところです。 サービス業とは何か? これらがサービス業です。 これらのことは、コンピュータができるようになったことでもあります。つまり、先進国の雇用の80%は、コンピュータができるようになった仕事だということです。これは何を意味しているのでしょうか? 「大丈夫、他の仕事で置き換えられるから。たとえばデータサイエンティストの仕事とか」と思うかもしれませんが、データサイエンティストがこれらのシステムを構築するのには大した時間はかかりません。 たとえば、今回取り上げた4つのアルゴリズムは1人の人間によって構築されました。こういうことは以前にも起き、新しいものが現れては、古い仕事が新しいものに置き換えられてきたというなら、その新しい仕事はどのようなものになるでしょうか? これを予測するのはとても困難です。なぜなら、人間の能力は徐々にしか発達しませんが、ディープ・ラーニングは指数関数的に発達しています。 我々はいまこの辺りです。「コンピュータはまだバカだ」と言っていても、5年もすればこのグラフを突き抜けてしまうでしょう。ですから、いますぐにこの能力について考える必要があるのです。 我々は以前にも似たような経験をしています。産業革命です。エンジンの出現によって能力に急激な変化が起きました。しかし、しばらくすると落ち着きました。社会的な混乱がありましたが、あらゆる場面でエンジンが動力を生み出すのに使われると、状況は安定しました。 機械学習革命は、産業革命とはまったく違った形になるでしょう。なぜなら、機械学習革命は留まることがないからです。より優れたコンピュータが知的活動を受け持つことにより、さらに知的活動に優れたコンピュータが作られます。 こうして、これまでに世界でも類を見ない変化が起きるのです。かつての常識では考えられないことです。 この影響はすでに現れています。この25年間、資本生産性は向上しましたが、労働生産性は横ばいか、むしろ少し下がっています。 だからこの議論をいま始めたいのです。この状況を伝えても、なかなか聞く耳をもってもらえません。「コンピュータは考えることができないし、感情を表すこともないし、詩を理解することもできない」と。 だから何だというのでしょう。人間がお金をもらって、時間を費やしてきた仕事が、いまやコンピュータにもできるようになってきています。ですから、いまこそこの新しい現実に目を向けるため、社会的および経済的な構造をどのように修正するか考え始めるべき時なのです。 ありがとうございました。

  
※ログミーでは、TED Talksおよび各TEDxの定めるCCライセンスを遵守し、自社で作成したオリジナルの書き起こし・翻訳テキストを非営利目的のページにて掲載しています。
×
×
×
この話をシェアしよう!
シェア ツイート はてブ
「産業革命以上のインパクト」機械学習がもたらす未来と、失われていく仕事

編集部のオススメ

おすすめログ

おすすめログ

人気ログランキング

TOPへ戻る