「10年以内に超知性が実現する」
孫正義氏:ソフトバンク株式会社の孫でございます。よろしくお願いします。最近いろんなアレルギーが飛んでいるみたいで、ちょっと声が枯れておりますが、よろしくお願いします。
1年に1回このSoftBank Worldで、これから起きるであろうと、少なくとも私がそう思っている近い未来について話す、そういう機会が今日であります。私なりの思い込みもあるかもしれません。でも、かなり強く思い込んでおりますので(笑)、そのつもりで聞いていただきたいと思います。それではさっそく始めます。
私は10年以内に超知性が実現すると思っています。このことが、どのように起きるのかを今日は話したいと思います。超知性とは何か、超知能とは何か。知性と知能の違いを考えてみたことがありますでしょうか。そのへんについても今日は語りたいと思います。
AGI(汎用人工知能)がやってくる。AGI、Artificial General Intelligenceですね。AGIの定義を一言で言えば、人工知能、AIが人間の知能とほぼ1対1になるレベルのことを、世の中ではAGIと定義されています。壁の向こうで聞いたら、人間がしゃべっているのかAIがしゃべっているのかわからないというレベルが、1つのテストであります。
AGIは、2023年のこの場でしたかね。私は「10年以内に来る」と確か言ったんじゃないかと思います。今、AGIは10年以内という思いではなくて、グッと近づきました。今日現在、私の正直な気持ちで思うAGIの達成時期は、2〜3年後にやって来ると考えています。
AGI(汎用人工知能)の5つのレベル
AGIには5つのレベルがあります。まず一般的な会話。これが人間とほぼ同等のスピードで、0.1秒から0.2秒以内にパンパン、パンパンと言葉のやり取りができる。しかも途中で遮っても、その内容を理解して会話が続く。まるで人間とそのまま会話しているようだと、これがレベル1の部分です。
レベル2は、すでに半年ぐらい前からOpenAIのChatGPT 4.0は、アメリカで言うと大学の医学部の試験に合格できる、法学部の試験に合格できるレベルに来ていました。しかしレベル2はすべてのサブジェクト、すべての科目、数学だとか物理だとか歴史だとか、ありとあらゆる科目で博士号レベル、PhDレベルの知能を持っている。これがレベル2です。
ここに来ているみなさんの中で、自分は5つぐらいの博士号のレベルを通る自信があるよという方がいたら……1人ぐらいいるかな。絶対にいませんよね。医学と、物理と、数学と、化学と、異なった分野で1人で全部博士号を持っている。そんな人はいないと思います。それでもAGIで言うところのレベル2であります。
レベル3は、エージェント機能。あなたの代わりにいろんなことをやってくれるという機能であります。ついにAGIが発明をしだすというのがレベル4。レベル5は、エージェントが1対1のレベルではなくて、組織的な活動を群れになってやっていく。これがレベル5であります。
今日は、そのAGIのレベル5を超えるような世界について話したいと思います。それがASI(人工超知能)の世界であります。AGIのレベルを一万倍ぐらい超えたもの。その叡智の部分、その知能の部分をASIと私は定義しました。
AGIの1万倍レベルの「ASI」が10年以内にやってくる
ASIの定義というとArtificial Super Intelligenceですから、どのくらいスーパーかと。AGIは1対1ですからみんなわかりやすいんですが、どのぐらいスーパーかというと、たくさん(笑)! 人によって「たくさん」の度合いが違うわけです。
いつかたくさんになる、ASIはいつか来るぞというと、あんまり異論はないんじゃないかと思うんですが。じゃあ、いつ、何倍ぐらいになるのかというと、そこには定義がないわけですね。明確に「いつ何倍だ」と勇気を持って言っている人は誰もいないです。
私は勇気を持って、人間の叡智であるAGIの1万倍レベルのものであるASIが10年以内に来ると思っています。しかもこのASI、人工知能が超知性に進化する。その超知性が10年以内にやってくる。この後、この知能と知性の違いについて述べていきます。
その詳細に入る前に、そもそも我々人間の脳細胞はどういう仕組みで物を考えたり、記憶したり、認識したりしているのか。
これはニューロンの写真ですが、我々人類の脳細胞の中にニューロンが何本ぐらい入っているか、自信を持って言える方はちょっと手を挙げてみていただけますか。
ああ、あんまりいないですね。あれ? ぜんぜんいないかな。いません。(正解は)約1,000億本です。ニューロンが1,000億本ある。ニューロンがくっついたり離れたりする作業をするんですが、それで記憶したり、考えたりするんです。このくっついたり離れたりというのをシナプスが行います。
ニューロンが木の幹だとすると、シナプスは枝葉に相当するものです。木の幹に細かい枝葉がいっぱい付いている。この枝葉と枝葉がくっついた時に、ニューロン同士がくっついて、電気的信号が流れる。あるいは化学的に物質がつながるんですが、これをシナプスと呼びます。
人間の脳には約100兆個のシナプスがある
このシナプスが人間の脳にいくつぐらいあるか、自信を持って答えられる方はちょっと手を挙げていただけますか。いませんね。つまりこのことは、ふだん我々の日常生活ではあまり考えない質問なんですね。我々の脳にいくつかのニューロンがあって、脳が考えているんです。脳が考えているというのは、実はシナプスが考えているんです。
このシナプスがくっついたり離れたりというのが、まるでコンピューターのトランジスタの世界のように、くっついたら電気が流れる、離れたら電気が流れないという仕組みになっているんですが、シナプスは我々の脳には約100兆個あると言われています。
さて、このニューロンの数、あるいはシナプスの数と我々の知能が、イヌやサルやトンボなどと比べてどのぐらい賢いかというのは、ニューロンの数、シナプスの数に概ね比例するということであります。我々人間の脳の1万分の1が金魚であります。魚ですね。それよりももっと少なくなると蚊とかになるわけです。
我々人類のシナプスの数は、20万年前ぐらいから今日に至るまで、まったく変わっていないんです。もうこれはDNAが我々の生命体を設計して定義しているわけですから、変わらないんですね。今から1000年後も、1万年後も変わらないんです。100兆個のままなんです。
しかし、このシナプスに相当する生成AIのパラメーターはものすごい勢いで伸びているんです。最近の生成AIでは、一番大きなモデルで概ね数兆個と言われております。
よく「日本的な生成AIを作るんだ」「我が社製」とかいろいろ言って、「日本製だから工夫をしよう」と。工夫をするということは、このパラメーターの数を少なくして、ほぼ似たような成果を出すようにしようとということです。
こういう努力をして「いや、少ないパラメーター数にすると電気があんまり要らなくなるんだ」「チップの数があんまり要らなくなるんだ」「だから効率が良いんだ」という努力を、小さくて美しい努力だ、日本的だという主張をする人がたくさんいるんですが、僕に言わせればそれは言い訳です。
競争社会では「一番優れた叡智」に圧倒的価値がある
GPUが買えない、電気が足りない、予算がないから仕方なくちっちゃくしている。それって、「日本の道は狭いから田んぼの畦道で通れるような二輪車を作る。自転車を作る。だからモータリゼーション、自動車の社会が来ても我が社は誇れる」と言っているようなもんで、それはもう僕に言わせれば小さな成功ですね。
やはり本道の世界で新しい技術の進化は起きています。つまり、数兆個では止まらない。数十兆個になり、数百兆個になる。バンバン伸びている。これが増えれば増えるほど、ざっくり言って賢くなるんです。もちろんちっちゃくして効率を上げるというのはあるんですが、やっぱり叡智の進化の本道は、強くて、賢くて、遥かに遥かに賢くて。
みなさんが小学校の時の宿題を解くのに、クラスで3番目とか10番目に成績の良い人に「宿題を教えて」と聞いたほうがいいのか、1番の生徒に聞いたほうがいいのかと。あえて「アイツは飯はあんまり食わなくても、5番でいいからアイツに聞こう」ということはあんまりないと思うんですね。やっぱり聞くとすれば、一番賢い、正解の者に価値があるということであります。
我々人間の社会、企業はみな競争していますから、競争の中では一番優れた叡智、一番優れた機能、そこに圧倒的価値が寄せられるということであります。
したがってニューロンの数を増やす、シナプスの数を増やすというパラメーターの競争は、この地球上にありとあらゆる生命体がいる中で、人類が最も賢い知的活動を行なっている。金魚にはABCはわからないということですね。
パラメーターがどんどんどんどん増える。しかもそれを有効に活用するモデル、そしてデータでファインチューニングしながら、どんどんやっていくということであります。
2023年頃からChatGPTの世界で革命が起きた
さて、我々ITの世界で情報革命という言葉をよく使いますが、情報って何でしょうか。ニュースに出てくる情報、天気予報、百科事典に出てくるような情報、いっぱいあります。これを検索していました。我々インターネットの世界の最大のアプリケーションの1つが、検索エンジンです。
情報が溢れるほどあって、それに一気にアクセスできるのがインターネットです。ありとあらゆる情報がインターネットにつながってアクセスできるから、この情報の大洪水のようなものの中で探し当てなきゃいけない。効率よく、素早く、正確に探し当てる。これが検索エンジンでした。情報には、検索という最大のアプリケーションがあったわけです。
検索をするというのは、我々の日常で毎日のように使っていますが、検索した情報の内容を、果たしてそのインターネットは理解していたかと言うと、そうではないと思うんですね。
知識というものがあります。知識というのは単に情報を知ることだけではなくて、知識を、内容を理解する。インターネットの情報検索は、必ずしも内容を理解しているんじゃないんです。キーワードで見つけてくるだけで、見つけたものの内容を理解するのは人間の頭でした。
初めてこれに革命が起きました。特に2023年あたりから、一気にChatGPTの世界で。GPTのPとTというのは「Pre-Training」ですね。我々の代わりにありとあらゆる知識を事前学習して、内容を理解しているということです。
ですから、質問した時に単なる検索ではなくて、質問した内容を理解して、その内容に基づいて答えを教えてくれる。これがGPTです。「これは何だろう?」と、知識を理解するということであります。