大きな可能性を秘めているデジタルツイン空間

ーーゲームAIのシステムを実際の都市空間そのものに応用するとは興味深いです。

三宅陽一郎氏(以下、三宅):さらに言うと、メタバース空間を現実と同期するデジタルツイン空間には非常に大きな可能性があると思っています。

なぜそういう空間を用意しなければいけないのか。ネガティブな理由としては、またコロナのような伝染病が来た時に社会がストップしないように、社会のある程度の機能を仮想空間に置いておくのが、非常に重要だからです。

「明日からメタバースで会議ね」とか「大雨で山手線がストップしたから、今日の会社はメタバースね」とか「買い物したいけど今日は渋谷に行けないから、109のメタバースで」とか、この3年間で、無意識のうちにけっこうみんな刻まれちゃったと思うので、そこの仮想空間と現実を同期することが非常に重要だと思っています。

図2. スパーシャルAIがつなぐスマートシティとメタバース

例えば、今日僕はスクエニのオフィスに来ているけど、仮想空間にもいる。ある人は自宅にいるけど、仮想空間にもいるとなると、都市が二重化するといいますかね。現実の都市と、それにそっくりなメタバース的な都市。スケールはぜんぜん違っていてもよくて、実はそこにAIが介入する余地がもっとたくさんできてくるんですよね。

例えば重要な会議に、ものすごくゲームAIに詳しいAIを作っておいて、それを派遣するとか、あるいは弁護士の知識を持っているAIがいるとか、あるいは自分がいなくても応答できるAIを置いておくとか。

そういうことでもう1つの社会を担保していくという役割がメタバースにはあって、それは技術的には実はゲーム産業が実現可能です。でも、ゲーム産業はメタバースに対するユニークな姿勢を取っています。

ーーゲームとメタバースの相違点はどこでしょうか?

三宅:ゲーム産業は、おもしろいものを作っちゃうんですね。とにかくおもしろくしようとする。でもメタバースって、メタバースそのものがおもしろかったら、ユーザーがプレイヤーになってしまう。SNSはおもしろいかというと、おもしろいけどそのおもしろいとは違う。小説のおもしろさとは違いますよね。SNSは極めて退屈なものだけど、退屈だからこそ、ユーザーがおもしろいことを言ったら、みんなが寄ってくるわけです。

SNS自体がおもしろいわけではなくて、中身をユーザーが作るからおもしろい。でも、ゲームの中身は、ゲームクリエイターが作るんですよ。それと同じようにメタバースにゲーム会社がおもしろいコンテンツをつぎ込んでも、それだけでは十分でなく、むしろあるところから逆効果になる可能性があります。メタバースはほとんどサービス空間なので、ユーザーがおもしろいことができればいいという空間なんですよね。

そこはオンラインゲームと似ているけど、ちょっと違う空間です。だからこそ実社会、実名、実会社の名前で活躍できて、AIが人と人をつなぐという役割をするんじゃないかなと思います。

営業も必ずしも歩き回らなくてもいい。メタバース上で地球の裏側の人と会って商談してもいいはずです。そういった実空間依存のところがどんどん、長い目で見ればなくなっていくんだけど、今回の第3次AIブームでそこまで行けるかどうかは、実はちょっとわからないなという感じですね。

現実空間・メタバース・仮想空間でやることはそんなに違わない

ーー第3次AIブームで実現できるかどうかは、まだわからないのですね。

三宅:メタバースを研究する、という研究者も多くはないです。スマートシティって、実は中東と東欧、北欧がすごく熱い。それぞれの地域差もあるし、アプローチと必要性もそれぞれ異なる。なので、そこはひょっとしたら第3次ブームとは関係ない文脈で、低空飛行で進むのかもしれませんね。

世間のいろいろなところで言われているのと、実際の研究や開発はけっこう乖離していて、これは残念だなというのがある分、逆にしっかりとした研究をしたいなと思っています。

僕にとってスマートシティとメタバースはゲームAIの延長でもあるんですよね。仮想空間で人間を喜ばせることと、現実空間やメタバースをやることは、そんなに違わない。むしろ問題としては、特殊から一般に向かっているかなと思います。

ゲームみたいにユーザーにおもしろがらせることが目標ではないので、その場所の犯罪がゼロにできたら一番いいなと思うんですよね。

これは賛否両論あるかもしれませんが、都市空間を全部AIが監視できれば、犯罪は基本的にはできなくなる……あと、テロとかそういう内部的なリスクを減らすこともできると思うんですよね。

「AIが全部監視するとなるとプライバシーはどうなるんだ」という意見もあると思いますが。一方で安全も大事です。そこは人それぞれですが、スマートシティとメタバースを組み合せた安全性の高い都市というシステムを組めるんじゃないのかなと思っていますね。

ゲームAIの次の10年の仕事は「記号主義型人工知能とディープラーニングをマージすること」

ーーゲーム業界のおけるAI技術の活用の状況はいかがでしょうか?

三宅:ゲームAI側は、今世間で騒がれている言語AIやディープラーニングの技術を今がんばって入れようとしています。

「よくゲームとかで使っているじゃん」という声も聞きますが、実はゲーム産業以外の人がゲームを使ってディープラーニング技術を鍛えているんです。囲碁もそうですし、将棋もそうですし、あれは全部ゲーム業界の外でやっている場合が多いですね。

なぜかというと、ゲームは人工知能を加速する箱庭だから。箱庭として利用している。しかし僕らはゲームそのものが対象で、ゲームにディープラーニングを入れちゃうとゲームそのものが不安定になっちゃうので、そこを克服する必要があります。

2022年まで、ディープラーニングを含んだゲームって、たぶん1桁しかないですよね。日本だと『SAMURAI SPIRITS』(SNK)の道場モード、海外だと『Forza Motorsport』(マイクロソフト)のDrivatarぐらいで現時点では本当に少ない。

ゲームの中にディープラーニングの学習のような重いシステムを入れられないので、開発時に学習して、推論をゲーム内で使う。しかし学習を完全にコントロールするには工夫がいります。技術はゲームそのものを良くしないといけないので、だったら手で作り込んだらいいじゃんっていう話になってしまう。なぜわざわざ学習させるのか? という話ですよね。

でも、2023年になってディープラーニング技術がいろいろなゲームの中に実装され始めていて、いずれものすごい勢いで入ってくるのは間違いないと思うんですよ。

ただ、これまでの伝統的なAI、要するに記号主義型AIと言われるものがゲームAIのメインで、ディープラーニングみたいなコネクショニズムは、どうしても内部がブラックボックスになるので使うなと言われていました。なぜかというと、ブラックボックスを入れると、ゲームをカスタマイズできなくなっちゃうから。

人工知能には、記号主義とコネクショニズムの2系統があります。コネクショニズムの代表格がディープニューラルネットワークですね。別にケンカしているわけじゃないけれど、70年間平衡状態でお互いを見ていた。お互い「自分が最高」みたいな感じでやってきたんですが、ここになってディープラーニングが優勢になりつつある。

とはいえ、検索エンジンとかは記号主義。この2つは違う技術だったのに、最近融合しつつある。つまりトップダウンで概念から人工知能を作るのは記号主義で、ゲームAIの技術がほとんどそうなんですね。

コネクショニズムのディープニューラルネットワークは、即物的というか物質的というか、ボトムアップなんですよ。ディープラーニングが役立つのは、キャラクターが狭い空間の中でどんなモーションができるか? みたいなところです。これは記号主義では解けません。そういう言葉にできない複雑な力学的なところはディープラーニングが得意なところで、今戦うべきか撤退するべきかみたいな抽象的判断が、記号主義が得意なところです。

今まではこの2つがぜんぜんつながらなかったんですけど、例えばChatGPTは、言葉というトップダウンのものを数値のベクトルに置き換えてディープラーニングにかけるので、この2つの融合点ではあるんです。

この2つの潮流をマージしたものが次のゲームAIのスタンダードなので、ゲームAIの技術はこれから10年でけっこう大幅に書き変わると思います。たぶん10年後の教科書は、今とはまったく違うものになっているはずで、その探究がこの10年である。だからやることは本当にいっぱいあるし、新しい仕事が待っているからむしろ誰にとってもチャンスだと思います。40年間で私たちが培ってきた記号主義型人工知能とディープラーニングをマージするという仕事が、ゲームAIの次の10年、20年の仕事だと思っています。

技術のマージができれば、これまでできなかったゲームデザインもできるから、ゲーム自身が変革されていくんですよね。キャラクターの振る舞いが賢くなったり、道具を使うのが異様にうまくなったり、ユーザーの心理を推定しながらゲームが進行したり、物語がジェネレートされたりなど、いろんな可能性があります。

「何が出てくるかわかりません」というものを商品として販売できない

三宅:ただ、今そこに業界としては慎重に進めているところです。

ーーなぜ、加速できないのでしょうか?

三宅:生成系AIは、素直に使えばコンテンツ生成に使うことができます。コンテンツ生成には、開発中にコンテンツ生成することと、ゲームが駆動中に生成することの2つがあります。前者はクリエーターの力をエンハンスする力となります。後者はゲーム内で、コンテンツを無限に生成しますが、しかし実際は何を出してくるかわからない怖さがあります。コンテンツはお出しする以上、管理する必要があります。生成系AIたちが何を食べて(学習して)成長しているかがわからない。とするとアウトプットも予想がつかないんです。

生成系AIは制御できるか?

ーー『SQUARE ENIX AI Tech Preview: THE PORTOPIA SERIAL MURDER CASE』でGPT2が使われたというニュースを見ましたが、あれは生成系AIの活用ですよね?

三宅:GPT-2の比較的小さなモデルの日本語クローンを入れて、メディアプレイ会を行いました。そもそもメモリに載るかどうか、というのと、ユーザーへのレスポンス時間などを加味して、これよりも大きなモデルであると待ち時間が長すぎてストレスが溜まる、という理由で、このサイズになっています。ただ、リリースしたものには含まれていません。

たとえ問題発言が生成された場合でも、フィルターをかけることで、その確率を低くすることはできる。でも、1万回中1回は問題が出るかもしれない。それはやはり画像でもシナリオ生成でも同じで、ゲームそのものに埋め込まれる生成系AIでは常に同じ問題がつきまとっています。

そこをどう乗り越えるかですよね。おそらくゲーム会社の場合、「そこをどうするのか」が共通の課題です。また、生成系AI自身が主張しなくても、ユーザーからの質問に答えるだけでも、問題のある意見を支持してしまう。

1つのソリューションとしては、自分たちで生成系AIを作ってしまう。その場合、あまりに大きなものはできません。構築と準備にもそれなりの時間がかかる。

あと、もう1つの問題は、ほとんどの生成モデルがサーバーモデルであること。ゲームはパッケージでサーバーじゃないですよね。サーバーの場合は使っただけお金を払わないといけないので、ゲームそのものに生成系AIを組み込むと、ユーザーが生成するほどコストが発生する。でもそんなゲームのビジネスモデルはないですよね。

ーーそうですね。

三宅:GPT-3はものすごく大きい。OpenAIは昔は本当のNPOだった。GPT-2は複数の大きさがあり、段階的に開放された。当初は小さいものしかフリーになっていなかったからGPT-2までは比較的使いやすかった。GPT-3からは、資本が入り、フリーに使えなくなった。

GPT-3からはもうサーバーモデルだし、規模も大きいので、ゲーム産業がどう折り合いをつけるか。

やはり最近よく「ジェネレーティブAIをなんでゲームに入れないんですか?」って聞かれるんですよね。入れようと思ったら、導入すること自体は当然、可能です。でも、お金の面と、ゲーム内でリアルタイムに生成する場合にはセキュリティの問題をどうするか。

クリエイティブ産業は、そこを越えなきゃいけない。そこをどうやって解決できるかな、と考えているうちに、ゲーム産業以外が生成系AIを使って、ユーザーもそれに慣れちゃう。

そんな中で、ゲーム産業はクリエーターによる創作をやめることはない。今でもそれが一番の価値があることだから。それでも、すべてが手作りである必要はない。

業界が生成系AIを取り込んだ先にはすごくいい未来が待っているはず

三宅:(ユーザーから)「なんでAIとしゃべれないの?」という声をたくさんお聞きします。僕の感覚では、2023年の初頭まではみんなそんなことを思っていなかった。

2022年の夏までは「AIとちょっと話せるの? すげぇ」みたいな時代だった。ところが2022年の秋から2023年初頭にかけて、がらっと状況が変わりました。

2023年が明けると、「あれ? AIとしゃべるってもう普通?」という時代に突入しました。ユーザーがそういう文化を吸収しちゃうと、逆にしゃべれないAIが時代遅れになる。

このまま行くと、間違いなく「ゲームはなんでキャラクターが話せないのだろう」となってしまう。それをなんとしても早く阻止せねばならないと思いますので、ちょっとギアを上げています。

コンテンツ産業だからこそ、「何を出してくるかわからない」というところに怖さを感じる。生成系AIとコンテンツ産業、音楽産業、アニメ産業、ゲーム産業、コンテンツそのものを売る業界が今まともに衝突していますが、逆に取り込んだ先には、すごくいい未来が待っているはずです。そこをなんとか取り込みたい。いい取り込み方をしたいと思っています。

(次回へつづく)