「それGeminiでできるじゃん」で潰される会社の特徴　独自開発が無駄になる分野と残る分野の見極め方 [2/2]

コピーリンクをコピー

ブックマーク記事をブックマーク

課題解決よりも、魅力的な提案をしてくれるAIがほしい

田中：これって先ほどのGoogleさんやOpenAIさんの「それを実装していたらどうするの？」という話とけっこう共通しているところが（ある気がします）。課題解決という考え方が、けっこう危険かもしれないなと思うんですよ。

深津：そうです。そうです。

田中：すぐに解決されちゃう。

深津：解決しちゃう。一番わかりやすい例だと、たぶん生活習慣病？

田中：うん。

深津：「生活習慣病を治します」というソリューションを考えたとするじゃないですか。だけど、中長期のAI社会でいうと、食生活の様子を見ながらいい感じの食事分配をしてくれて、塩分の摂りすぎになる前に、塩分が少なめのミッションをくれるので。「そもそも成人病にならないんじゃないの？」みたいな感じになっていくと思うんですよね。

田中：あぁ、なるほどね。実際にそういう意味でいうと、問題解決よりは「こういう世界を作りたい」みたいな課題が。

深津：そうなんですよ。やはり提案ですね。

田中：そうですね。だから「成人病にならない」というよりも「70歳になってもめちゃくちゃ走れる体を作ろう」とかですね。それに対して、すごくロイヤリティが高まって。機能性やソフトウェアというより、そのサービスと一緒に生活をしていると、なんか楽しいみたいな。

深津：そうですね。

田中：そういうことになるかもしれないですね。

深津：そうですね。なので70歳になった時も、記憶力がはっきりで、いろんなものを創作できるタイプと、徹夜できるような生き方と、山登りとかがガンガンできるのとで「どういうふうに生きたいですか？」みたいな感じになったりするかもしれないですね。

田中：あぁ、そっか。それの（支援をする）AIが、ずっと長く使ってもらえるかもしれないし。

深津：そうですね。

AIが人の五感以上の情報を獲得し、“匠”の領域に近づいていく

田中：なるほど。あと、僕が思うのは当時の2023年と比べると、もうマルチモーダルがすごく進んだなという気がしていて。

深津：あぁ、確かに。

田中：当時の生成AIってLLMよりも先だったのが画像じゃないですか。画像から「これは、どういう画像ですか？」というのを出したり。その次に「文字を入れたら、その画像を作ってくれる」とか。我々は今、当たり前に受け入れていますけど。6〜7年前に出てきた時には、めちゃくちゃビックリしましたよね。

深津：そうですね。たぶんマルチモーダルは専門家というより、僕の勝手な妄想なんですけど。やはり「画像だけ」「テキストだけ」より、画像とテキストの両方を知ってるほうが、となってくると「これからいくと、赤外線も取れるほうがさらに賢くなるよね？」とか。人類が知らない触覚センサを持っていることで、第6感的なことがさらに出来上がってきたりする気がするんですよね。

田中：なるほど。だから人間の可聴域は限られますけれども、その可聴域を越えて学んでくるみたいな。あとはやはりマルチモーダルで、テキストや映像などは最近は境目がなくなってきていますよね。

深津：そうですね。なので、いわゆる人間でいうところの統合された状態というのは、各要素が別のものじゃなくて、混ざって1つの概念として。なんかそういう匠とか達人の領域に近づいていっている印象はあります。

全体を俯瞰して動けるAIに近づいている

田中：ここ1年で本当に変わったなと思うことは、昔の音声翻訳は音声をテキストにして、テキストを翻訳して、それを音声に変えていたんですよね。今って、音声から音声に直接（翻訳）するじゃないですか。おまけに映像音声から映像音声だから、口パクの部分も日本語でしゃべったものが英語の口パクに変わるじゃないですか。

そういう意味で、本当にマルチモーダルが単に複数を扱えるというんじゃなくて、おっしゃったように統合されたという感じがしますよね。

深津：そうですよね。これが身体とか物づくりといったご自身の経験で想像してもらうとわかりやすいんですけど。料理をする時に「右手を動かす」「爪を切らないようにする」ということを意識しているレベルと、そういうものを超越して、冷蔵庫全体の中からなんだかイイ感じにおいしいものを作れるとかだと、なんかぜんぜんレベルが違ってくるじゃないですか。

田中：そうですよね。コンテキストがね。

深津：そう。そういう細かい各要素じゃなくて、全体を見て動けるようなところにどんどん近づいているなと。

AIは、ほぼ永遠に近くスケーリングしていく？

田中：なるほど。ちなみに、複合的な要素はあるんでしょうけど、なぜそれができるようになったと思われますか？　研究なんですかね？　データなんですかね？

深津：基本的には先ほどの統合という、それぞれ別のものとして、要素として丸暗記していたものがネットワークとして接続されていったというのが、一番大きいとは思います。それともう1つはデータの量じゃないかなとは。

田中：なるほど。確かにそういう意味だと、生成AIに関しても、そもそもニューラルネットワークやAIって50年以上前から研究がなされていたわけじゃないですか。どっちかっていうと計算資源がなかったり、ネットワークの機能性がなかったりという資源側の問題だったと思うんですけど。資源が無尽蔵に増えている今は、永遠に改善され続ける気もするんですけど、どうでしょうね？

深津：どうでしょう。僕は基本的には「永遠に近くスケーリングしていくんじゃないか？」とは思うんですけども。統合の先の、統合の統合の統合みたいになっていった時に、こういうグラフで上がってくるところが現れるのか。それとも、こういう（下降）グラフになっていくのかはちょっと……。究極的にどこに行くのかまでは、まだわからない。「開けてみないとわからない！」みたいな。

田中：そうですよね。実は僕が今日「そうなのか！」と新たな発見があったのは、「赤外線まで見える」という話なんですけども。実は紫外線も赤外線も単に波長が違うだけなんですよね。単に「人間はこの範囲しか見えません」というだけで。その機能が解放されると、赤外線も紫外線も視力の中の1つでしかないし、電波もすごく波が細かいだけだから。

音声の延長線上にあるじゃないですか。要は、センサーがめちゃくちゃ性能が良くなって人間の脳を超越して統合的に処理されたとすると、まったく違う結果を出してくるかもですね。

AIが“第六感”を手に入れる可能性がある

深津：そうですね。そうなると思います。例えば一番わかりやすい例だと、噓発見器みたいなものがあるとして、普通の人間と同じ量のデータセットで嘘を発見していたら、たぶん表情の変化や瞳孔の範囲でしか嘘を見つけられないとなる。それが赤外線が入ってくると、なんかその人の全身の緊張や発汗を見るほうが（検知するのが）楽になってきたり。

人類が把握できないレベルで、何か物事を理解できるようになるような気がする。

田中：そっか。六感ですよね。

深津：そうですね。ただ、たぶんそこにいくための課題が、人類が取れないデータを大量に集めるということだとすると、大半は人類がレビューできないデータもあるので。それを評価可能にしていくようなステップが必要になってくるかなと。

田中：そもそも、その（人間にレビューできる）範囲を越えて学習させていると「なぜそういうアウトプットになったかはわからないけれども、結果は合っている」という状況になるわけですね。

深津：そうです。それでAIに聞いたら、なんか「すごく小さい周波数でこういう振動が起きている時には、こういうことが起きるんです」みたいに説明されるので。「それは人間にはわからないな」というふうになってきたりするんじゃないですかね。

田中：それこそ創薬の分野とかはすごいですよね。「この振動を発生させないようにするためには、神経系はどうやったらいいんですか？」と聞くと「こういうふうな要素があればいいですよ」とかを教えてくれるわけですよね。

深津：そうですね。そういうふうになる。たぶんもう少しすると、AIがどんどん自己学習できるようになっていって。

そうなると、そういうセンサーは振動でも、赤外線でも、電磁波でも、放射線でも、とりあえず渡しておけば中長期だとだんだん理解してくれるようになるから。「変わるんじゃないかな？」と、勝手に思っています。ここは専門家というよりは、けっこう素人考えの想像ですけど。

田中：そうですね。

続きを読むには会員登録
（無料）が必要です。

会員登録していただくと、すべての記事が制限なく閲覧でき、
スピーカーフォローや記事のブックマークなど、便利な機能がご利用いただけます。

無料会員登録

すでに会員の方はこちらからログイン

または

名刺アプリ「Eight」をご利用中の方は
こちらを読み込むだけで、すぐに記事が読めます！

スマホで読み込んで
ログインまたは登録作業をスキップ

名刺アプリ「Eight」をご利用中の方は

デジタル名刺で
ログインまたは会員登録

ボタンをタップするだけで

すぐに記事が読めます！