これまでのコンピューティングの概念を変える第5世代の波

菅波憲一氏:アームのリージョナルマーケティングの菅波でございます。(代表取締役社長の)内海(弦)からみなさまにすごく熱心にお話ししたため、時間が押しております。駆け足でいきたいと思います。

私のいる部署では、2年から5年先くらいのプロダクトや新しいビジネスモデルを見ています。現時点から少し先を見ますと、コンピューティングについて「5番目の波が来ています」というような言い方を社内でしています。

弊社はCPUやGPUを手がけておりますので、コンピューティングという演算したり、結果を出したりというところを受け持っているわけですけれども。ここに5番目の波が来ています。

波とは何かと言いますと、“現状でリニアに進んでいるものから、ガクンと変わる分岐点”ということが言えるかと思います。

キーワードは、みなさまもよく目にされると思いますけれども、5G、それからAI、IoT。こういったところがこれからどんどんどんどん進んでいくと、そこに使われるエンジンがガツンと変わってくる。そういうタイミングに今差し掛かってきております。

この4つが少し今引っ張っているかたちです。(そして)自動運転、エッジサーバー、スマートフォンはこれからまっすぐ進んでいきますが、もう1つ、この先,AIウェアラブルとしてXRが出てきてます。

とは言いましても、この4つに使われるコンピューティング性能、コンピューティングの機能というものが、今まであったものとまるっきり変わってきます。

まるっきり違う用途を演じてくるということで、私たちはこれをキャッチアップして、どこがどう違うのかを、今理解して次に進んでいくというところです。この先のスライドで、情報を展開させていただければと考えております。

デバイス市場の次のゲームチェンジャーは「没入感」

ここに「New Experiences Are New Opportunities」と書いてありますけれども。5G、さっきのAIですね。それからラージスクリーンコンピュータ、内海がさっきお話した超低消費電力のパソコン。こういったものが来ます。

デバイスそのものはどこかで聞いたことがあるんですけれども、ユーザーの方々の使い方とか利用する仕方というのが、どんどんどんどん変わってきている。

「こんなことに使えるんだったら、こういうローパワー化がいるよね」というのはわかりやすいですが「こういう使い方があるので、もっと短時間でこの処理ができなきゃいけない」とか、「もっとこういうふうにできなきゃいけない」というのが今増えてきている。そんなところが一番大きなポイントで、今日お話する内容にもなります。

もう1つ別の変化点から見ますと、2007年・2014年・2021年と、7年おきに3つカテゴリーをわけてみました。まず2007年はどんなことがあったかというのを振り返ると、「コミュニケーション」が1つのバズワードになって、ここを中心に進んでいた。

「ブラウジング」というものがあってPCがありました。スマホ市場が立ち上がってデジタルカメラがあって、これがつながっていく。SNSの基盤になるような技術がこの時代に展開されてきました。

それから7年経って2014年になりますと、今度はそれらが微細化、小さくなって「ウェアラブル」「IoT」という言葉が盛んに言われ始めてきました。ヘルス、フィットネス、それからセンサー、バイオテクノロジー。こういったものが組み合わさっていく時代でした。

そして2021年。まだちょっと先です。ここになると、どういうものにデマンドが走っていくかというようなところを、我々のほうで今検討しています。

私たちArmが考えているのは「イマーシブ」。日本語にするとやや堅いんですが、「没入感」。没入感という言葉も、なんとなく市民権を得てきているんですけれども。

今までは繋がる、コミュニケーション(の時代だった)。それから何かを測ってセンターデバイスやクラウドにあげる、というかたちだったんですけれども、2021年、このくらいになると「感情」が入ってきます。

ユーザーの感情とか体験がそのまま反映される。もしくは、そういった新しい世界観とか体験というものが瞬時に得られるようなデバイスが、来そうな状態になってきています。

これが今かなり新聞など賑わせていますけど、次のゲームチェンジャーになるんじゃないかというところで(事業が)走っています。

ARに求められるのは「瞬時な体験を実現させる」コンピューティング技術

ここからは少しARの話をさせていただきます。このARですけれども、先ほどのとおりコンピューティング、5番目の波というところでお話すると、今まで単純に演算するものに比べますと少し変わってきます。

まずはビジョンですね。これは外の世界を映すためのカメラがつきます。外の世界を映すというのと同時に、「使っているユーザーが今何をしているか」という内側も映しだして、その結果の処理をすることが求められているコンピュート性能、技術となります。

続いてはHMI、ヒューマンインターフェース。ジェスチャーです。どういう動きをして機械、マシンに知らせるのか。それから音声認識。もうこれはかなり出ていますけれども、音声によって次のコマンドを出すというかたちに広がっています。

さらに言うと、そこで使われているオブジェクトですね。実際にあるもの見えているものと、ユーザーがコマンドで出したものがサーバーから飛んできて、それが実際にグラフィックスとして今見えているものに対して張り付いてくる。それが仮想現実とか拡張現実、XR、ARになっていくわけです。

それもすべてが瞬時に行われるようなコンピュートパワー、それからコンピュート性能が求められます。少しビデオをご紹介します。

(動画)

今見ていただいたデバイスがこれから来るとなったときに、先ほどのとおりユーザーの経験からくるものなので、(デバイスを)着けてみないとなかなかどういうものかという実体験は得られません。

着けた瞬間にみなさんが「なるほど、これだったらこう使える」、もしくは「これだったらこういうビジネスモデルが生まれる」というようなかたちで入ってくるようなタイプのプロダクトになってまいります。

先ほど申し上げたとおり、例えばビジョニング、ジェスチャー、それからオブジェクト検出が瞬時に行われないと、やはりユーザーは“没入感”に対してしっかり満足できなくなります。ここの部分のコンピューティング性能、技術が、すごくシビアになってまいります。

AI・機械学習の処理を“エッジデバイスで行う”向きが強くなってきた

その中で、さらに重要なポジショニングになるコンピュート性能を司る、やはりAI、マシンラーニングのところになってまいります。

私どもも去年の講演ですと、「AI、マシンラーニングはいったいどこで実行されるべきか」という議論をさせていただいておりました。「クラウドで行われるべきだ」もしくは「エッジサーバーで行われるべきだ」という議論がよくなされていました。

ところが昨今、エンドポイント、やはりみなさんが持たれているエッジのデバイスで、ある程度のAI、マシンラーニングの処理をさせるべきだ、という議論が非常に活発です。

理由はいくつかあります。先ほどのとおりセキュリティもありますし、帯域、リアルタイム性が非常に大きなファクターになってきております。

もう1つ、次のビデオをご覧いただきたいと思います。次のビデオも意味合いとしては「エンドポイント、エッジでAIを持ったときにどういうことが起こるか」というようなビデオでございます。ご覧ください。

(動画)

先ほど内海も申しましたとおり、「サーバーですべての処理を行って、クライアントはシンクライアントでいい」という動きが確かに去年一昨年の議論ではすごく多かったです。

しかし今年に入りまして、「エッジでもローパワーでありながら、かなりパワフルなマシンラーニングの処理ができるようになるんじゃないか」という想定とか検証みたいなものが行われています。

今、エッジデバイスでこのようにマシンラーニングのある程度のものができるし、させるんだというようなところが、始まってきています。

パートナー300社の多くがCPU・GPUでマシンラーニング処理している

その中で、もう1つ我々がよくお問い合わせいただく議論として、「マシンラーニングを、エッジデバイスの中のどの演算エンジンでやらせるのが一番いいですか?」というような議論をよくいただきます。これは我々も「どれがいいですかね?」という議論になるんですけれども。

(スライドを指して)私どもがパートナー様300社、300プロダクトに「現時点でどこでAIをやらせてますか?」というアンケートをしたときの分布になっております。実はまだまだ、マシンラーニングをCPUとかGPUでやらせるというところが非常に多いです。

これには、いろんな意味合いがあります。もちろん得意かどうかとしてはNPUというようなものがあります。マシンラーニングを専用にやる、インファレンスの部分ですけれども、プロセッサー、アクセラレーターがあります。ただし実態としてはCPUとGPUを使うというケースが非常に多いです。

その理由はすごく明確でして、今スマートフォンが世界中に40億、こういった巨大な数出回っています。この中に入っているプロセッサーが、CPUとGPUになります。

これからNPUも入っていくという予想は立てられているんですけども、今現在のエッジデバイスでマシンラーニングをしようとすると、その処理先、実行先としてはCPU、GPUとなります。

そうすると当然エコシステム、そこでアプリケーションソフトウェアを作る。そこで通信をさせる。先ほどのとおりサーベイをされている会社様はみなさん、「じゃあCPUで何がどれくらいできるのか」というようなところの研究検討が行われます。

CPUとGPUのより一層のパフォーマンス向上ですとか、マシンラーニングに対しての機能、こういったものが重要になってくるとArmでは考えております。

スマホデバイスにおいて、超巨大な計算能力よりも重要なこと

(スライドを指して)スマートフォンですね。今スマートフォンの中でも、AI・マシンラーニング技術が入っています。

これが一例です。スマートフォンで東京タワーを撮ってみます。そうするとサーバー連携をして、例えばですけれども、こういったかたちで「これが東京タワーですよ」っていうのがわかって。そこに対してガイドが出てくる。

東京タワーが何メートルで、いつくらいにできて、というインフォメーションが瞬時にあがってくるサービスが、もうすでにあります。ただしこのサービスを完結するまでに、スマホの中でどういった技術が動いているかをちょっとだけお伝えします。

まずは、リアルタイムのビデオのキャプチャリング。カメラから東京タワーを撮って瞬時に送るというかたちですね。ビデオ解析、実際にそれが何なのか、東京タワーなのかどうなのかというようなところ。もしくはユーザーが音声で解析を依頼するといったときのオーディオの検出、音の検出、声の検出が同時に行われます。

続いてあるのが、映像のオーバーレイ。今見えている絵とサーバーから送ってくる絵を重ね合わせて、グラフィカルにユーザーに映し出すということが行われて、最後にライブストリーム。データを含めたものが動画で送られてくる。

この4つが瞬時に、実際にはバラバラでなんですけれども、ユーザーとしてはデバイスに映した瞬間にこれが実行されて先ほどのようなガイドが出る。そうでないと、一番最初に申し上げた没入感が得られません。 ですので、CPUに関しては、超巨大な計算能力よりも瞬時にできるリアルタイムオートですとか、低レイテンシーと呼ばれている技術が非常に重要になってきております。

強固なセキュリティをもった“トータルコンピュート”構想

第5世代、5番目の波が来ているというコンピュート。先ほどのGPUでやるのがいいのか、CPUでやるのがいいのかという議論の中、私たちは今「トータルコンピュート」というかたちで、エンジンそのものをプラットフォーム化しようとしています。

ユーザーがCPUでやらせるほうがいい、GPUでやらせるほうがいいという議論を持たなくていいように、もう1レイヤー高いところでArmがプラットフォーム化をする。「このプラットフォームであれば、このくらいのマシンラーニング、AIが動きますよ」と提案しようとしています。

その提案のコンセプトとしては、当然性能が重要なんですけれども、先ほど内海が申しましたとおりもう1つ大変重要なのが、セキュリティです。

セキュリティも、「CPUではこんなセキュリティがあります」「GPUではこんなセキュリティがあります」ではフレームワークとして成り立たないので、我々はプラットフォームとしてのセキュリティの強化を目指しております。

こちらも駆け足で進みたいところではあります。セキュリティは、さまざまなところで使われています。これもスマートフォンが少しリードをし始めていますが、今スマートフォンそのものが本人認証のデバイスになりかけています。カード決済もできますし、バンキングもできます。

いろんなパスワードが眠っているという中で、このデバイスそのものに高いセキュリティ技術の実現のために、今ものすごく投資されています。整備もされています。それがトータルコンピュートのプラットフォームとして組み込み機器に落ちるというところが、我々が今見ているところです。

これはセキュリティの脅威に対しての数字です。マルウェアの数300パーセント、3倍。年々増えています。2番目はIoTデバイスに対してのアタッキング。これは6倍に増えています。実際にそれで受けるダメージに対してのコストは6兆ドルです。

我々も機器メーカーさんとよくお話をして、「お金が一番かかっているのはどこですか」と聞くと、「CPUとかGPUの部分ではなくてセキュリティに対するコストです」というお話がすぐに返ってくるくらいです。

ですので、Armそのものはプロセッサに対して、まだものすごく注力をさせているんですけれども、そこに載るセキュリティに大変大きな投資をかけて、技術的な確立を目指しています。

ここからは、そのセキュリティやコンピュートパワーをもって、どのへんに対して方向感を定義しているのか、スライドでまとめたいと思います。

誰もが使いやすく短時間でデバイス化できるプラットフォームを作る

まずはクラウド、エッジ、インフラストラクチャー。先ほどのとおり、サーバーがあります。しかしサーバーがエッジサーバーというかたちでエンドデバイス側に近づいていきます。これはいくつか理由がありますが、私が見ているところからするとエッジデバイスのレイテンシーです。

通信のレイテンシーが、先ほどのとおり没入感を妨げています。ですのでサーバーはできるだけ近くにあったほうがいい。マイクロサーバー、エッジサーバーと呼ばれるものになってまいります。

もう1つは車です。車も今までのとおりいくわけではなく、オートノマス・ドライビング(自動運転)になりますと、そこに対してもマシンラーニング、セキュリティ、レイテンシーが非常に大きな役割を担ってまいります。

トータルコンピュートと呼ぶものはできるだけジェネリックにしながらも、先ほどのとおり新しい第5世代になりますと、コンピュート性能とセキュリティ(が重要になるということ)ですね。

さらに言うと、そこから標準化をしていって、誰もが使いやすく短時間でデバイス化ができるような取り組みが、このトータルコンピュートのプラットフォームになります。

それから2つ目、3つ目、4つ目は連動しています。エッジデバイスとしてはAR、グラス、こういったものが来る。その中に入るエッジのAI化。さらに言うと、クラウドとの連携。そこでのセキュリティ。こういったものに、Armがものすごく注力していきます。

そのエッジデバイスが車になる。それからIoTデバイスになる。そうしたときのエコシステムも大事になってきておりまして、我々のほうで力を入れているところです。

駆け足で私のパートを進ませていただきましたけれども、これにて終わらせていただきたいと思います。ご清聴ありがとうございました。

(会場拍手)