ログイン

会員登録

検索

ログイン

メニュー

検索

ログイン

メニュー

三宅陽一郎氏インタビュー

2023.05.09 - 2023.05.09

三宅陽一郎氏が説く、シンギュラリティの向こう側（全3記事）

2023.06.28

メインカテゴリテクノロジー

「業界はしばらく大騒動だけど、すごく新しくて、おもしろい」　スクエニ・三宅氏が語る、生成AIの発展により訪れる“ゲーム産業の一大変革期”

リンクをコピー

記事をブックマークブックマーク解除

画像・スライド一覧

米国OpenAI社が公開した「ChatGPT」が盛り上がりを見せている中、議論されがちなのは“AIの脅威”。それではエンジニアやプログラマーにとって、AIは脅威なのでしょうか？それとも新たな相棒なのでしょうか？今回は、株式会社スクウェア・エニックスのジェネラル・マネージャーリードAIリサーチャーである三宅陽一郎氏に、AIの一般化によるエンジニア、そして人類の未来についておうかがいしました。全3回。3回目は、生成系AIの発展による、ゲーム業界の未来について。前回はこちら。

生成系AI活用の鍵は、いかにエンハンスメントに持っていくか

ーー生成系AIは、何を出してくるかわからない怖さがあるとのことでしたが、コンテンツ産業で生成系AIを使うことはやはり難しいのでしょうか？コンテンツ産業だからこその使い方はなにかあるのでしょうか？

三宅陽一郎氏（以下、三宅）：もちろん、開発中に生成系AIを使う、というアプローチはあります。その場合には生成したものを十分に確認できる時間がありますから、生成に問題があっても克服できると思います。例えばいっぱいクリーチャーを作るために、「カマキリとアライグマを混ぜたらどんな感じ？」とか「壁打ち」の壁として使ってみる。

変な画像が返ってくる時もあるけれど、1人で悩んでいるより、あれやこれやとやって最終的にいいものができたら後は自分で描けばいいみたいな。

あとは企画ですね。ゲームはいろいろアイデアを出さないといけないんですけど、その時に古代中国の妖怪といっても、図書館に行かないとわからない。今だとChatGPTに「古代中国の妖怪を出せ」と言ったら、たぶんわんさか出してくれるから1人ブレインストーミングが容易になってくる。

そういうかたちでも使うことはできるんですよね。つまり、いかに開発者のエンハンスメントに持っていくかですね。プロフェッショナルな領域では、生成系AIは人間のオルタナティブ（代替）ではまずないんですよ。

そのエンハンスメントに持っていくための仕組みを作るのが、ゲームAIエンジニアの役割なんです。

クラウド上にデータを溜めて大きなAIを作って、それを人類みんなで使いましょうという時代になりつつあるわけですよね。それを使ってオリジナリティを出すということになります。

そのために必要なのは、ファインチューニングという技術です。これは大規模生成モデルを、それぞれの用途に合うようにチューニングする技術です。大規模生成モデルという共通基盤から、それぞれの産業、それぞれの職種に応じて特化させていくことです。例えば、ゲームであれば、何かもかも現実世界のことを知っているよりも、優先的にファンタジーワールドについて精通する必要があるわけです。

一方で、そういう生成系AIを各企業内で作る、という道があります。ただ、それは世界を席巻する超巨大モデルほど大きくできない。これが今、本当に難しい問題。小さくてもいいからオリジナルの生成系を持つべきか、大きくて高性能なAIを借りるのか。どっちが正しいのか。各分野でも話が違うし、昨日まで正しかった議論が今日粉砕されたりします。そこが逆におもしろい時代ですが、けっこう悩ましいですね。

たぶんほかのゲーム産業全体、同じような立場の人はみんな悩んでいると思いますね。巨大な生成系AIを持ってきて、ファインチューニングして、自分たちの会社にちょっと偏りを持たせて生成させて、大きな獣をうまく飼いならすか、小さな雛を自分たちのいいように育てるか。どっちが正しいのか判断するのがとても難しいですね。

大規模言語モデルに関しては、いっそのこと、日本で日本語の生成AIモデルを作る、というのも、良い方法であると思います。

チャンスは20年ぶり、ゲームAIの一大変革期

ーー日本でも、ChatGPTに匹敵するようなものを作りたいという話が、ちょっと出ていますよね。

三宅：そうですよね。みんなが安価で使えてセキュリティがいい日本語のやつがあればいいですね。

ただ、言語AI、NLPという分野は、たぶん全国の研究室を全部集めても100を切っちゃうんじゃないかなと思います。

かつ、研究者は英語で研究する場合が多い。なぜかというと、国際会議で発表するなら英語のほうに大きな共通基盤があるから。じゃあ、誰が日本語の研究をしているんだろう？　日本語となると。さらにもっと少なくなってしまう。

それでも私たち日本のゲーム会社は、日本語から出発しないといけない。英語でよくできていても、日本語では性能が落ちる、という話はけっこうよくあります。

言語モデルは、当然、言語依存の分野です。そんな分野って、テクノロジーでほかにあまりないですね。人工知能のほとんどの分野は汎用的な分野なんですが、言語だけは日本語の理論と英語の理論がほとんど違う。文法構造がまったく違うし、ましてやデータに至ってはまったく質も集まり方も違います。

ーーなるほど。日本の現状ではなかなか難しいんですね。

三宅：ようやくキャラクターに話をさせることができる時代が来たので、楽しみではあります。なので、全体としては、ゲームAIの一大変革期なんですよ。これぐらいのチャンスは20年ぶりかもしれません。

ゲームAIがそれまでの単なるルールベースからロボットの人工知能技術を入れて変革されたのが2000年ぐらい。その発展を20年間続けてきたんですが、次の20年はまったく違う景色になるので、これはこれでとてもわくわくするんですよね。

20年前も、AIを入れると言ったら躊躇する開発者は多かった。「何を考えているのかがわからないAIはデバッグできるのか」という意見でした。

昔のキャラクターの経路は、道に1個1個点を打つんですよ。これ、超安全じゃないですか。しかし、AIはこれを計算で導くのです。経路計算にはいろいろなテクニックがあるんですが、ゲーム内の状況にあわせて計算するので、毎回結果も違うし、保証はできない。「このAIは自分で道を作って、道を発見してたどってくれます」と言ったら、「どこを通るかわからないじゃないか」「引っかかったら誰が責任を持つの？」という意見がありました。

それはそのとおりなので、導入と同時に安全性を担保するアルゴリズムを何重にも入れなければならない。それは、どんな人工知能技術のゲームへの導入でも同様です。生成系AIでもやはりそう。

それと同じことがいろいろなところで起こっています。今は、次に何をするかもAIが自分で判断します。昔のAIは、「ここに来たら魔法弾を撃ちます」とか決まっていたんです。だから何回やっても同じ動作になって動作上は安全なわけですよね。

それを思うと、今みんなが心配しているジェネレーティブAIにゲーム内で生成させる場合も同じで、20年前に言われていたセリフとあまり変わらないんですよ。「何が生成されるかわからないじゃない？」みたいな。

だからこそ意外性もあるし、いろいろなゲームデザインができるわけですよね。そこは常にAIが直面する問題で、古く固定されてきたところがどんどん変化するものになっていくというのがAIの歴史なんです。

今回は、ゲームそのものが自分で自分を変化させる力を持つようになる。そうすると、マップがローディングされて変わらないものであるところから、「マップなんてAIがローディング中の10秒で作っちゃうよ、お城の位置なんかは毎回違うからね。敵は何が出てくるか俺も知らんわ。でもおもしろいよ」というゲームができる。おもしろい配置にするのが技術になります。

そういう、ゲームそのものの概念が変わりつつあるんですよね。それを受け入れるのは確かにつらいことではあるんですよ。これまで「僕が作ったマップ」とか、「俺が作ったイベント」とか、「俺が配置したモンスター」とか、「どや？」みたいな世界から、「もうAIが作っていますよ」みたいな世界になった時に、ゲーム開発者が「ゲームって俺が思っていたのと違う」みたいなことはあるかもしれません。でも、それは人工知能が提供できる新しい未来なんです。

ベテランと若手で組んで作っていく必要がある

ーー生成系AIの発展により、クリエイターやエンジニアが向き合うべき課題が新しく出てくるということですか？

三宅：クリエイターやエンジニアにとって、意識を変えなければいけないというのは難しいところだと思います。

数年以上のキャリアを持つ技術者は、そもそも入社した当時ディープラーニング技術がなかった。今の若い層は、AIはディープラーニングのような教育を受けて入ってくる。これはある意味、今の時代を象徴しています。

第3次AIブームの中でAI教育を受けた人は、そういうふうに教育されて入ってくる。そのほうが就職に有利だし、学生もそれをやりたがる。今さら1980年代、1990年代の教科書を読みたくないですよね。全部リセットされたのが10年前なので、10年分だけ勉強して最先端に立ちたいと思うのは、それはそうかもしれない。

若い人から見ると10年前以上の知識は古い領分なので、そこを技術の拠点にはしたくない。

でも、そんな簡単な話ではないんです。ディープラーニング技術はディープラーニング技術だし、今でもゲームAIの90パーセントは記号主義で作られています。しかし、その比率は徐々にディープラーニングの比重が大きくなる方向に変化していく。

一方で、ゲーム開発においてディープラーニング系に応用実績はあるかというと、まだとても少ない。ディープラーニングだけが入るということはないんですよ。エンドツーエンドっていうんですが、すべてのシステムをディープラーニングにしていたら人間が手を出せなくなってしまうので、ゲーム開発では使えない。

だから今、ステートマシンやビヘイビアツリーといった記号主義的人工知能とディープラーニングを組み合わせた技術を開発しています。そんなことを研究しているのは、ゲーム産業だけかもしれませんが、ここが変化の落としどころだと思っています。

それを、ベテランと若手で組んで作っていく必要がある。伝統的なゲームAIにも、ディープラーニングにも、どちらにも長所と価値がある。記号主義の技術がいかに今ゲーム産業の骨格になっているかがわからないと、ディープラーニングは逆に入らないという話なんですね。

ディープラーニングはすごく柔らかい技術なんですね。細かいところにうまく調整していくんですが、なかなか骨格にはなれない。記号主義で一瞬なところを、何度も学習して獲得していくのも効率が悪いし、そこはむしろ人の手でコントロールしたい。だから、ゲームAIの構造的骨格は、実は古典的なAIのほうが圧倒的に速くて強い。鉄骨みたいなものですね。その骨格に柔らかなディープラーニング技術をうまく組み合わせるにはどうしたらいいかを考えてこそ、お互いの価値があると思います。

いろいろな意味で変革期の今、すごく新しくておもしろい

ーー生成系AIに限らず、AIの発展がゲーム業界を少しずつ変えているのですね。

三宅：そうですね。さっきも言いましたが、ゲームの概念が変わる中で、特に昔から作ってきた人たちがそれを受け入れるのは簡単なことではないと思います。でもそこは、どっちにしろ乗り越えないといけないことです。今ではパス検索が当たり前の技術ですが、20年前にAIを導入した時には反対されていたのと同じように、今、ジェネレーティブAIたちに対して最初に抵抗があるのはむしろ当たり前です。

それを逆にうまく利用して、飲み込まないことには競争に勝てないし、新しいゲームデザインが生まれないと思います。ゲームAIはまさに今、岐路に立っています。

ゲーム産業は、しばらくは混乱していると思います。それは過渡期にありがちな、良い意味の混沌です。5年ぐらいしたらなんとなく方向が見えてくると思うんですけどね。いろいろな意味で変革期なので、しばらくは大騒動ですね。すごく新しくて、おもしろいですね。