CLOSE

孫正義氏とサム・アルトマン氏対談(全3記事)

孫正義氏、現在のAI活況は「インターネット創世記を思い出させる」 OpenAIのサム・アルトマン氏と対談

2025年2月3日に行われた法人向け特別イベント「AIによる法人ビジネスの変革」で、OpenAIとソフトバンクグループ、Arm、ソフトバンク合同で、企業用最先端AI「クリスタル・インテリジェンス(Cristal intaelligence)」に関するパートナーシップについて発表しました。イベントの中でソフトバンクグループ会長・孫正義氏はOpenAIのサム・アルトマン氏と対談。ChatGPTなどの生成AIが今後、爆発的に成長していく可能性などを語り合いました。

孫正義氏 × サム・アルトマン氏が対談

司会者:ただ今よりトークセッションを始めさせていただきます。それではお願いいたします。

孫正義氏(以下、孫):※1どうもありがとうございました。今からサム(・アルトマン)とフリーディスカッションをします。



質問の時間というより、僕が代わりにみなさんに代わって、たくさん聞きたいであろうことを直接サムに聞きますので、楽しみにしていただきたいと思います。サム、すばらしいデモでしたね。

サム・アルトマン氏(以下、アルトマン):ありがとうございます。

孫:今日のアナウンス、非常にうれしく思っております。

アルトマン:私もです。

孫:「Stargate」についてはどう思われましたか?

アルトマン:なかなかの瞬間でしたね。すばらしい瞬間に居合わせることができました。

孫:我々、「本当に発表できるのか?」という話もしていましたけど、本当にできましたね。

アルトマン:けっこう長いこと話をしていて、どうやってすべてを整理してできるようになるかという話をしていたと思います。これができて本当にうれしく思います。

世界ではこれからコンピュートが本当に重要となってくると思います。数分前にもお話しできましたが、より小さいモデルでいろんなことができるようになるんですが、さらにインテリジェンス、知性がさらに前に進んでいくということ。これについては、さらにコンピュート、演算能力が必要となってくるということになりますので。

我々、このモデルを作るために、間違いなく何百、何千という演算能力が必要となっていくと。それが広い大きなサイズでできることは非常にすばらしいと思っています。

孫:以前、「AGIがいつ来るんだ?」とあなたに聞いたことがありましたね。その時、「コンピュートパワーはどれぐらいになるのか?」の質問に、あなたからの答えは「多ければ多いほどいい」と。非常にシンプルな答えだったと思います。

そこで考えたのが、多ければ多いほどいいということは、たくさん必要なんだなと。

アルトマン:そうですね。

現在のAI活況、インターネット創成期を思い出させる

孫:ここでたくさんやるということで、Stargateを発表したわけなんですが、これが限定的な演算能力ではなくて、より多ければ多いほどいい、より多くの能力があったほうがいい。もちろんそれは間違いないですよね。

人によっては、小さく圧縮したかたちでもできる方もいらっしゃるかもしれませんが、それだと答えも小さい。

アルトマン:多くの方がわかっていないところとして、リターンがどれだけ大きく変わるかがわかっていないと。どれだけコストをかければ、小さいモデルでももちろん大きなコストをかけたほうがやはり大きなリターンがあることはあると思います。



孫:インターネットの創成期を思い出させるんですね。インターネットが始まった時は1995年でしたでしょうか。

この頃はPCで大きな文字で、非常に時間がかかり、お金も大きくかかり、そこからブロードバンドが入ってきて、「なんでこんだけキャパシティが必要なんだ?」と言われましたし、「帯域がなんでこんなに必要なんだ?」とも言われました。

より多くの帯域があることで、キャパシティがあることで、「これで十分だ」「もう要らない」「これ以上は大きくならないでしょう」と言う方もいらっしゃったかと思います。

でもその後、より高画質の写真、そして動画が始まりました。そうするともう、キャパシティがもっともっと必要だということがわかってきたわけですね。

それで最初みなさんはインターネットを、「バーチャルなことだから」「本当に使えるものはないよね」と言う方も多かったですし、基本的には無料のサービスばっかりだから、大してビジネスモデルも立たないという非難や批判は今となっては「ナンセンスだ」と感じます。

アルトマン:「インテリジェンス、知性だと、どれだけ賢くなる必要があるんだ?」と聞かれますが、賢ければ賢いほどいい。それが難しい質問や問題、課題を解決することができるわけですから。

孫:そうですね。

ChatGPTは1年で10倍改良されているように見える

孫:モデルとしては、かなり開発・改良されてきたと思います。1年に10倍ぐらいモデルは改善されていますかね。どれぐらいで測れますか?

アルトマン:ざっくりですが、私からすると、これは科学的な根拠はありませんし、ざっくりした答えになるかもしれませんけど、毎年1つずつIQが上がっていくと。それから毎年使っているコストが半分になっている気もしています。

孫:チップ当たりにするとコストは10分の1ぐらいですかね。そうすると、同じ予算で10倍のチップを買うことができるということですよね。

アルトマン:そうですね。それからアルゴリズムもさらに効率的になりますから、結果としてそこも違ってくると。どういったかたちで起きているかというと、例えば、もちろん当然のように受け止めることもできるかもしれませんが。

実は2018年、2019年、「GTP-1」と「2」が出た頃。みなさん、ご覧になった時には、そんなに真剣に考えていなかった、見ていなかったかもしれません。「GPT-3」が出た時には、これが人によっては初めて「あっ」と思われた方もいると思います。「GPT-4」になると、「実際にかなり使えるね」と。

こういった昔のコンピューター・ミュージアムに15年前ぐらいに行ったことがあるんですが、「Xerox Alto」を使っていました。当時はどうしていたかと、そこからコンピューターはどうなってきたかも見えるわけですが、50年前から今……50歳のコンピューターのように思います。

GPT-3は数年前にできたもので、やはり今使うと「えっ? こんなもん?」と思いますよね。ChatGPTから2年前にできたものですね。2022年の11月末にできてきましたが、GPT-4が出たのが2023年の3月でしたか。

こういった進捗を見ますと、これだけモデルが素早く改善をされて、より安くなっていることも明確にわかってきました。このカーブが非常に急激に上がっているとも思います。

孫:私からするとこのモデルは、1年に10倍ぐらい改善されている、改良されているように感じますし、パフォーマンスは、実際にはチップ自体も、ジェンスン(注:NVIDIA CEO、ジェンスン・フアン氏)の努力、業界の努力があって10倍になっているように感じます。

その上でStargateができれば、チップの数も10倍、1年に増やすこともできると。10倍×10倍×10倍ということで、1,000倍ということ……年間または2年間で1,000倍になると。

その次、翌年にはさらに10倍×10倍×10倍で1,000倍と。1,000倍×1,000倍で100万倍と。そうすると、1回、2回、3回とそれを掛けていくと、1,000倍×1,000倍×1,000倍と。そうすると10億倍ということになりますから。

生成AIは2次曲線的に成長している

孫:みなさんからすると直近の発表で、「DeepSeek」の発表がありましたが、彼らはこれだけ真似ができるんだ、キャッチアップができるんだ。1年後にはより安くなるかもしれません。

サムがさらにそこから上を行くというかたちで「(OpenAI )o3」「o4」が近いうちに出るのかもしれませんし、どれだけ2次曲線的に改良しているかが気づかれていないところだと思います。



アルトマン:実際に自分で生きて見ているとなかなか感じにくいかもしれませんが、これは間違いなくそういった改良・開発がされていると思います。

孫:それはすごいことですよね。例えば10億倍が数年後に出てくるということになれば、そうかもしれませんけど、さらに10年となると、あり得ないほどのすごいインテリジェンス、知性が生まれると。今、人が予想できないほどのものになるということですよね。

人間はリニア、直線で考えがちですが、2次曲線となりますと、これをさらに超えると。直線をまさに超えて成長していくことになりますから。一番前を行っているサムはまさにそれを感じていますよね?

アルトマン:そうですね、私のキャリアの中で、どんどんそれを信じて進んでいくしかないと思います。我々としては概念的にはなかなか難しいんですが、それを信じて進むしかないと思っています。

孫:そうすると今でも開発や革新の速度は、さらに楽しみにされているわけですよね。

アルトマン:そうですね。o3がどれほど悪かったと数年後に思うかもしれませんよね。

孫:であれば、エージェントが生まれて、プロンプティングだと。これは難しいから私にはできないと思われるかもしれませんが、これだけの革新が進んでいくと、それも簡単になっていくと、ユーザーが感じるさまざまな導入(のハードル)も必要なくなっちゃうと。よりフレンドリーになり使いやすくなると。

近い将来、表情や声色を理解するAIが現れる

孫:今ここでしゃべっているような音声で、例えばお互いに目を見て話しているようなかたちで、我々のAIに目を向けて声で、または目を見て話すことができるようなことになるわけですよね。

アルトマン:そのとおりです。テキストボックスから価値がどれだけ生まれているかはなかなか気づきにくいと思うんですけれども。

孫:例えば水晶玉、クリスタルに話すのと同じですよね。これでさらに価値が生まれると。これで顔を見て理解をし、いろんな音声のトーンを理解したり、ここで今コミュニケーションをしているように、声の感情を読んだり周りを見たり、どこを見ているか、それ自体を確認をしたりするのと同じようなかたちになりますよね。それが非常に近いうちに起きると言えると思います。

でも、人によるとStargateは「CAPEX(設備投資)が多すぎる。どうやって回収するんだ? マサ、金あるのか?」とか言う人もいます。どう思いますか? まだまだたくさん容量が必要です。そしてテクノロジーを出すためのアップサイドがまだまだあると思いますが、どうでしょうか?

アルトマン:私も言いたかったことなんですが、リターンですね。インテリジェンスが直線的に伸びるとしたら、それに対するレベニュー、リターンは2次曲線的な伸びだと思います。やはり経済に対する価値はもっと作られると思います。もちろんCAPEXはかかります。それでも同じようにレベニュー、収入も伸びていきます。

孫:イーロン・マスク。私たちの共通の友人ですね。

アルトマン:あなたの友人じゃないですか?(笑)。

孫:(笑)。「マサ、お金あるのか?」。だけども、絶対実現させますよ。言っておきますけども、実現しますよ。我々は「銀行(Bank)」じゃなくて「ソフトバンク(SoftBank)」なんだと申し上げたいです。絶対に実現させます。

生成AIはジョークさえ理解してくれる

孫:Stargateももちろん日本に展開させなければいけません。我々はもちろん規制に準拠しなければいけない。それからプライバシーとかセキュリティの問題には対応しなければいけませんが……。

アルトマン:ソフトバンクが大きなデータセンターを作っていますので。

孫:イノベーションの中心は、いわゆるメインブレイン、脳をトレーニングすることはアメリカでやりますが、いろんな国にセキュリティの問題があり、文化があります。

ですから私どもは、日本やほかの国家にももちろんそれぞれの国、セキュリティを尊重しながら展開できると思っています。

アルトマン:もちろんアメリカの試みで始まるわけですが、私どもはAGIをすべての人類に届けたいというのがビジョンですので、いろんな言葉とかカルチャーはあるでしょうが、展開できると思います。

孫:日本の一部の写真を撮って、「これ、どこだと思う?」と聞くと、当時の「o1」は、「これはここじゃないか?」「なんでわかったの? GPS使ったの?」とかって聞くと、「いや、そうじゃない」って言うんです。o1は「GPSは使っていない」と言うんですね。

「この石やコケを見て、レンガや石がどういうふうに積み上げられているかを見ると、この500年前の文化じゃないか。この歴史的な史跡じゃないかと思ったんだ」と。まさにそういう推論だったんですね。私はその当時すごくびっくりしたんです。「この日本のここの場所、なんでわかるの?」と思ったんです。すごく頭いいなと当時も思いました。

予測をする、推論をする。細かいデータのみならず推測する、そしてその史跡までたどり着くというのはすばらしいなと思いました。すごくびっくりしました。

私のジョークさえ理解してくれたんです。「大阪弁でジョーク言ってみて」と実は話しかけたんですね。日本にはいろんな方言があるんですが、「大阪弁でジョークを言って」と言ったら、大阪弁でジョークを言い始めたんです。「なんでこれおもしろいの? 説明してよ」と言ったら説明してくれたんです。びっくりしました。

文化や文脈もわかっていたんですね。今はすでにそうなっているわけです。ただそれが今後を考えた時に、もう毎日毎日驚きます。今でもすごいすごいと毎日驚いています。
※1 英語での対談の同時通訳を書き起こしたものです。内容および解釈については英語原⽂が優先されます。英語動画

続きを読むには会員登録
(無料)が必要です。

会員登録していただくと、すべての記事が制限なく閲覧でき、
著者フォローや記事の保存機能など、便利な機能がご利用いただけます。

無料会員登録

会員の方はこちら

関連タグ:

この記事のスピーカー

同じログの記事

コミュニティ情報

Brand Topics

Brand Topics

人気の記事

新着イベント

ログミーBusinessに
記事掲載しませんか?

イベント・インタビュー・対談 etc.

“編集しない編集”で、
スピーカーの「意図をそのまま」お届け!