Googleの最新技術動向

司会者:それではさっそくですが、前半のプレゼンテーションパートに入っていきたいと思います。Google I/Oレポートと題しまして、及川さん、よろしくお願いいたします。

及川卓也氏(以下、及川):こんばんは、及川と申します。よろしくお願いいたします。

私は、Google I/Oというイベントでの発表を中心に、Googleの最近の技術動向についてお話をさせていただきたいと思っています。私の次が、(インフラジスティックス・ジャパンの)東さんと(日本マイクロソフトの)井上さんによる、MicrosoftのBuildというカンファレンスに関する講演です。

面白いことに、今年はGoogleとMicrosoftのイベントがほぼ重なっていたんですね。毎年ちょっとはずれていたのですが、このたびは1日早くMicrosoftのBuildが始まって、その翌日からGoogle I/Oが始まったので、同じ人が両方のイベントに出ることは不可能でした。

IT系の技術動向や各社の戦略がわかるカンファレンスとしては、このほかにも、AppleのWWDC(Worldwide Developers Conference)やFacebookのF8といった開発者向けのカンファレンスがあります。

今回はこの中から業界を代表する2社……おっと、AWSを抜かしましたね、IBMも抜かしました。いろいろと敵に回してしまったかもしれません(笑)。が、本日の登壇者が参加したカンファレンスということで、代表的なものとして今回はこの2社を選び、みなさんといろいろと技術動向を共有して、その活用などを考えていきたいと思っています。

簡単に私の自己紹介をします。現在はクライス&カンパニーの顧問というかたちで、技術系人材の採用のお手伝い、もしくはエンジニアのキャリア構築というところでもお手伝いをさせていただいています。

以前はMicrosoftやGoogleに在籍したこともございました。

7,000人もの技術者が集まった「Google I/O 2018」

Google I/Oは、もう10年も連続して開催されているものでして、一昨年から野外でやるようになりました。今年は7,000人強の参加者がいたと聞いています。

ブレイクアウトセッションが160以上、ほかに「Office Hours」と言われているGoogleの技術者に相談できる場所や、「App Review」という、実際に作ったアプリケーションをレビューしてもらう場があります。スライド左側には「Waymo(ウェイモ)」と呼ばれる自動運転車が実際に展示されていたりするのもご覧いただけると思います。

この写真からも雰囲気を読み取って頂けるかと思いますが、Google I/Oは、開発者が技術を習得するという場だけではなく、一種の祭典のようなかたちで、Google技術に興味があるエンジニアを世界中から集めて交流を図る場になっています。

今回は、Google I/Oでの発表を中心としながら、それ以外も含めて、Googleの最近の技術動向として、いくつかポイントをご紹介をさせていただきます。ここに書いてある5つの領域で分類します。

一番最初に、いわゆるコグニティブ、AI、機械学習と言われているところの話をさせていただきます。

まず最初に申し上げるのは、Googleは一昔前となる3年〜4年ぐらい前に、デスクトップではなくモバイルだということで、「モバイルファースト」という宣言をしました。スマホ中心であることや、AndroidおよびIOSに向けてユーザー体験を良くしていくと言っていたのですが、去年には「AIファースト」を宣言しています。

実際に、Googleはgoogle.ai (ai.google) というサイトを持っていて、ここに自分たちのAI戦略や技術情報を全部載せているのですが、面白いことに、もともとのGoogleのリサーチサイトを全部ここに集約しています。

つまり、Google自身の技術戦略や研究のテーマの主軸にAIが入ってきていることが、対外的にもはっきりとわかるようになっています。

従来のGoogleのサービスがAIで高機能化

Google I/Oの中ではまず最初に、いろんなかたちの応用について話されておりました。Microsoftさんもやられている医療への応用では、例えば、網膜の写真から健康状態がわかるというような話や、医療機関にかかった履歴などから、その人の健康の予測ができたりします。

あとはアクセシビリティというところでは、2人の話者が同時に会話した場合でも、音声の認識以外にビジュアル面での認識を用いることで、片方の話者の声だけを取り出せるようになっています。また、目の不自由な方がモールス信号で入力を行う機能などを発表していました。

製品への応用も、ほぼすべての製品に何らかのAI機能が入っているという状況です。例えばGmailで、今までもスマートリプライというかたちで、来たメールに対して返信を自動作成してくれていました。今回は、返信だけではなく、新たに文章を作るときも、まるで統合開発環境(IDE)のAuto-completion(自動補完機能)のように、どんどん文章を作成してくれるものが発表されています。

あとはGoogleフォト。これ自身はAIがないとできなかった製品なのですが、テキスト等を自動的に認識したら、PDFに変換してくれたり、色を一部分だけ目立つようにして、写真を見やすくしたり。もしくは白黒写真をカラー化するというようなことができるようになります。

あとはGoogleマップでも、機械学習を活用して、「あなた向け」という形でパーソナライズした情報を出しています。

また、日本ではまだ出ていないのですが、Google Lensという製品が昨年、Google I/Oで発表されまして、その強化といわれているところも出てきています。

テキストの抽出とか、あとは、まるで昔のSF映画の「マイノリティ・リポート」のような感じですが、カメラでポスターを照らすと、そのポスターのアーティストのビデオがすぐに流れたり、(ライブ)チケットの購入ができるなど、自分が必要としているものを機械が自動判定してサービスを提供してくれるということが実現できるようになっています。

AI技術を実感できる「Googleアシスタント」

今一番、コンシューマーの方にAI技術を感じていただけるのは、おそらく、アシスタント機能である「Googleアシスタント」だと思います。ここでもいくつかの発表がありました。たとえば、新しい“声”が追加されました。

米国にJohn Legendというアーティストがいるのですが、彼の声も今回追加されています。ただ追加すると言っても、当たり前ですが、Googleアシスタントで用いる、すべての会話を録音しているわけではありません。代表的なフレーズを入れるだけで、他の会話はシンセサイズされるようになっており、ここにAlphaGoを開発したDeepMind(という企業)のWaveNetという技術が使われるようになっています。

ほかにも、「Ok,Google」「ねぇ、Google」と毎回言わなければいけない面倒くささがが解決されています。いわゆるコンテキストの共有というかたちで、(Googleアシスタントに)1回呼びかけることによって、そのあとの会話がGoogleアシスタントに対しての依頼であるかどうか判断できるようになっています。

さらには、今は質問を1個1個しか聞けませんが、1つにまとめて質問できるようになります。これは高度な自然言語処理(NLP)などにより実現されています。

また、AndroidやIOSを使ったときに、ユーザーに対して、音声だけではなくビジュアルとともにサービスを提供した方が便利なことがあると思います。

たとえば、ホームオートメーションのような操作を行う際のように、「温度を何度に設定して」と言ったあと、ビジュアルでダイヤル操作をした方が微調整がやりやすいときには、そのビジュアル(ダイヤル操作の画面)を(表示して)提供できるようになっています。

また、これはニュースでも非常に大きく取り上げられましたが、電話での会話をコンピューターが勝手にやってくれるというものです。

デモの中では、実際の店舗にかけたものとして、ビデオというか音声が流れたのですが、(一つは)美容院の予約(の電話)。もう一つはレストランの予約というところで、とくにこのレストランの予約がなかなか要領を得ない会話だったにも関わらず、きちっと予約を完了するところまでできています。

ちょっとだけいうと、「これは本当にどこまでできているの?」といった話も、実はそのあと、米国のメディア等でもいろいろと言われているところがあるのですが、デモをしたということは、あそこまで完成度が高くないにしても、近い将来、同じようなことが可能ではないか、と予見されるものになっています。

着々と進化を続ける自動運転技術

先ほどもちょっと言いましたが、Googleの親会社であるAlphabetの子会社、要はGoogleの関連会社のWaymoの自動運転車の話です。Google I/Oの期間中、私はGoogleの本社があるマウンテンビューにいて、自動車で移動をしていました。

1日運転していると、もう二度三度は、この実験車に普通に会います。日本にいるとあまりそういった(自動運転の実験者に遭遇するという)経験はありませんが、向こうでは普通に日常に溶け込んでいるんですね。

そのように、かなりのマイル数の実験を重ねた結果、Waymoの自動運転車は高いレベルにまで進化しているのですが、今回、Google I/Oに初めてWaymoの担当者が登壇し、こんなことまでできるようになっている、ということを話しています。

1つは、こういった雪の悪天候の中、Waymo(の自動運転車)にはどう見えているかということ。

左側がまずそのまま見たもので、右側がその雪を除去したときに、ここまで鮮明に見えているという画像処理の結果を見せています。

この結果を受けて問題なく走れたかどうかまでは、はっきりとした言及はありませんでしたが、ほかの例も含めて、ほとんどのケースでは、人間が運転するよりも安全ではないかと思わせるようなレベルまで達していることがわかります。