AI活用は即効性があるスキル

池田朋弘氏(以下、池田):それではセッション4つ目、「知っておきたい2024年の生成AI最新動向:3つのトレンドと5つの業務効率化事例」です。Twitter(現X)や、最近はテレビや「ABEMA」にもよく出演されていらっしゃる茶圓さんにお越しいただきました。茶圓さん、よろしくお願いします。

茶圓将裕氏(以下、茶圓):はい、よろしくお願いします。では、30分ぐらいしかないので、サクサクいこうと思います。

池田:ありがとうございます。

茶圓:初めての方もいらっしゃると思うので、簡単に弊社、株式会社デジライズの紹介からさせていただきます。弊社は主にAIの研修や、企業向けのChatGPTを作ったり、システム開発を行っている会社でございます。特に研修×ツールをセットで販売しています。

そこの実績としては、2023年の11月から始めて、もう50社、延べ9,000名以上の方に研修のご提供をさせていただいています。恐らく企業向けのAI研修では、日本でもトップクラスなんじゃないかなと思っております。上場企業も多数導入いただいております。

日本の生成AI普及率は、今上場企業でも10パーセントぐらいと言われています。中小企業さまを含めると、恐らく2~3パーセント程度かなと思います。アメリカはもうトップ500のうちの92パーセントが使っていると。大きく差が開いているので、なんとか日本も10パーセントから80パーセントまで持っていこうというミッションを掲げながら、日々営業活動をしている次第です。

そこに共感いただき、上場企業さまを含めて、今代理店さまが20社ほどいるんですけども。パーソルさん等も含めて上場企業さまと業務提携を進めて、いろいろ活動しています。

AI活用は即効性があるスキルかと思いますので、GMOさんでは、「グループ全体で月間9万時間を削減できた」というプレスリリースも出していただいております。使う場所としては、後ほどゆっくり話すんですけども、メールの文章や英文のメール添削、たくさんのところで活用いただいています。

Xのフォロワー11万人超、AIの情報発信を行う茶圓将裕氏

茶圓:そのまま私の自己紹介に入ります。私は学生時代からずっと起業しておりました。最初のキャリアとしては、まず英語圏に留学した後は、中国上海で日系企業のインターンとして、社会人をスタートしました。その後上海で独立して、最初は人材紹介などを行っていました。昔からずっとITは好きだったので、コロナもあって、帰国後はずっとIT領域で事業をしていました。

2022年11月にChatGPTが出て、それを触っているうちに、「これは本当に世界が変わるな」という確信を持ちました。ずっと家に引きこもってAIの情報を発信しておりましたら、おかげさまでXのフォロワーが今11万人と。一般人枠のAI業界の中では、恐らくトップクラスに多くなっています。

それもあって、「NewsPicks」のプロピッカーや、『サンデージャポン』さんなど、テレビ出演もさせていただいています。GMOのAIの顧問もさせていただいていたり、あとは一般社団法人生成AI活用普及協会でも、協議員として活動しております。

今日は短い時間ではありますが、私が日々リサーチしている中で、「このAIの使い方がいいよ」という話や、2024年のトレンドについてお話ししていきたいと思います。

あと開発でいくと、AIとリアルタイムで英会話したり、自分の話した英語を文字起こしして、添削いただけるサービスとか。あとは千原せいじさんとAIチャットボットを作ったり、いろんなことをしています。

X経由で採用も強化しておりまして、会社を立ち上げた2023年は400人ぐらいに申し込みいただいて、うち80人ぐらいがエンジニアという。今開発もがんばって増やしています。

仕事で使うならChatGPTが優勢

茶圓:最初に、最新の生成AIトレンドのお話をさせていただきます。今回参加している方は、たぶんリテラシーが高いと思うので大丈夫かと思いますが。そもそも生成AIとは何かと言いますと、いわゆるAIの中の一部です。

AIイコールではなくて、生成AIの中に機械学習とか深層学習とかいろんな学習手法があって、それで作られたのが生成AIです。一言で言うと、何かを作るようなことですね。テキスト、画像、音声などを作るのが生成AIと言われています。

時間がないのであまり細かい技術の話はしませんが、興味があったら別途、そういったテーマでセミナーができればと思います。

生成AIを語る上で欠かせないのは、やはり「ChatGPT」かなと思います。「Claude」とか「Gemini」もあるものの、ChatGPTがなんだかんだ一強を保っている印象です。すごいのは、たった2ヶ月でユーザーが1億人を突破したところでございます。TikTok、Instagramだと9ヶ月、30ヶ月かかっているところが、なんとChatGPTだと、たった2ヶ月で突破したと。

運営している会社も2015年創業のOpenAIで、今9年目ぐらいです。でももう時価総額も15兆円ぐらいになっていますし、社員も現在は700名ぐらいで、非常に少数精鋭で運営している会社です。

2023年のニュースですけど、基本的に2023年はずっとOpenAIのニュースばっかりかなと。ちょこちょこAIツールはあるものの、仕事で使う幅を見たら、ChatGPTがやはり優勢かなも思います。

「Gemini 1.5 Pro」は個人的に最強

茶圓:2024年の私の思うトレンド3つを、先にお話しさせていただきます。まずは、さらに賢いAIモデルが出るんじゃないかなと。あとは「行動をするLLM」という、だいぶ話が難しいと思うんですけど、いわゆるアクションをすることとか。あと「マルチモーダル化(テキスト・画像・音声・動画など複数の種類のデータを一度に処理できるAIの技術)」、この3点に注目しております。

別途最近は、LLMの小型化とオンデバイスにも注目しています。スマホでLLMを使うこともけっこう流行ってきているので、より身近になってくるのかなという印象です。

先にGPT-5からいきますと、夏ぐらいに出るかなとも言われておりますが、まだ真相はわからないですね。噂レベルでございます。一応、「2023年から開発しています」と言っていますし、商標を取ったりしているので、準備は着々としております。

GPT-4が出たのが2023年の3月14日なので、ちょうど1年記念に出ると言われていたんですけども、結局出ず。今は「Claude 3」が使いやすいよと、Twitterではけっこう話題かなと思います。

今主要なもので言うと、まずChatGPTがあります。あとはClaudeがありますと。ClaudeはAnthropicという会社で、元OpenAIの研究者が辞めて作ったド競合です。あとは「Gemini」ですね。あとはMetaとかいろいろあるんですけども、だいたいこの3つが、ユーザーが使いやすいチャットボットの一覧かなというところです。

みなさん使っている方は少ないかもしれないですけども、私が一番愛用している「Gemini 1.5 Pro」。これは個人的に最強ですね。トークン数で100万トークンあるところと、かつ、動画も解析できるので、唯一マルチモーダル化もしています。

ただ、これはGeminiには搭載されてなくて、API(Application Programming Interface:接続先のOSを呼び出すことや互いのソフトウェアやアプリケーション機能の一部を共有すること)としてしか出てないので、「Google AI Studio」であれば活用いただけるかなと。興味のある方は検索をしたらたぶん使えると思います。

各AIの性能を検証した「AIカオスマップ」

茶圓:そんなかたちで私は日々、いろんな同じ文章をAIに入力して試したりしています。最近は「Gemini 1.5 Pro」は最強だよという話をしたデモがけっこう話題になったんですけど。「マルチモーダル」というテーマで、AIのいろんな検証をしました。こういうめちゃくちゃな、AIカオスマップを各AIに学習させました。

(「この画像を元に企業名をすべて抜け漏れなく書き出して」という指示を出すと、)GPT-4だと、「多すぎるのでそもそも無理ですよ」となって、断念されました。Claudeは、「Claude 3 Opus」という最上位モデルを使ったらがんばったんですけど。Geminiだけ3分ぐらい出力しているという。この精度で出力できるので、すごいですよね。

池田:おお。やばいですね。

茶圓:頭1つ抜けているので、Googleの強みはマルチモーダルかなと思っています。なので、次にGPT-5が出るなら、こういったことは恐らくできるだろうと。トークン数が増えて、マルチモーダルの精度や、画像解析の精度が上がったりとかが、今後実装されるかなと予測しております。

続いては、いわゆる「行動するLLM」というところです。これは2023年末からよく話題になっているんですけども。言語ではなく行動の出力とは何かと言うと、今のChatGPTも、例えば「Xの投稿を作って」と言うと、それなりに文章を作ってくれます。

ただ、(文章を作っても、ChatGPTが)投稿するわけではないですよね。「行動の出力」というのは、「Xに投稿して」と言うと、自動でXにログインして、勝手に投稿するイメージです。それを今、「Large Action Model」(コンピュータ上で人間の意図を理解し実行する、新しい基礎モデル)みたいにうたう会社もありますね。

音声の指示だけで実行してくれるAIも

茶圓:こちらの2024年1月に出た「rabbit r1」というスマートフォンは、次世代のスマートフォンとも言われております。スマホなんですけど、ボタンが1個しかなくて、音声で全部入力するイメージです。

例えば「タクシーを呼んで」と言ったら、音声を聞いて勝手にタクシーを呼んだりしてくれます。アプリ間を越えて作業をするみたいなイメージでございます。この「Large Action Model」というのが、今後、2024年は特に話題かなと。いわゆる「Code Interpreter」(話し言葉の指示でプログラムを生成・実行し、結果を出力してくれるGPT-4の追加機能)みたいな感じですね。

「Open Interpreter」(自然言語でプログラムを開発し実行までできるオープンソースのツール)というのは、まさにローカル環境で使えるCode Interpreter。いわゆるPythonのコードでいろんなプログラミング処理を行う機能が、要はMacのようなパソコンのOSレベルで使えると。このOpen Interpreterが2023年に出て、けっこう話題となっています。

例えば「記事を書いてアップして」と言ったら、勝手にブログにアップしてくれますし、「YouTubeを開いて」と言ったらYouTubeを開いてくれます。そういったものが最近主流かなと思っています。

今朝ちょうど投稿したんですけれども、それがスマホレベルでも動いています。スマホで動く軽量な「Octopus v2」というものです。スマホでメールを書くのも速いですし、コードの出力に近いなと思っていまして。

今後これがもっと進むと、音声で「メールを書いておいて」とか「Googleカレンダーに予定を入れておいて」みたいに言うだけで実行できるかなと思っております。

マーケティングで勝ちに行くOpenAI

茶圓:さらに進んでいくと、例えば「毎月10万円稼ぐ仕事を作っておいて」と言ったら、勝手に検索してクラウドワークスで案件を取って納品したりも、可能になるかもしれません。こんな非常に楽しい未来が待っているのかなという印象でございます。

池田:今ってOpen Interpreterもちょっとハードルが高いので。基本的に導入が大変だし、操作もちょっと怖いっていうか、たぶん普通の人が簡単に使えるUIでもないと思うんですけど。そういうのがもうちょっと一般化しそうな感じはしますよね。

茶圓:確実にすると思いますね。まだ本当に黎明期ではあるので、ここからかなと思います。インターネットで言うと、Windowsが普及し出した1996年ぐらいと思っていただければ。たぶん当時からすると、FacebookやAirbnb、Uberが出るとは思ってなかったんですけど。

池田:確かに。

茶圓:そんな感じで10年、15年経つと、今では考えられないような企業やサービスが、世界を牛耳っている可能性もあるので。

池田:楽しみですね。すばらしい。

茶圓:はい、楽しみでございます。あとは「マルチモーダル」で、「Sora」ですね。2024年2月に発表されて話題になってましたけども。結局なかなか出ないというところで、出る出る詐欺を行っています。

OpenAIはマーケティングがうまいなと。これ(Sora)はGemini 1.5 Proが公開された瞬間に、Googleの話題を消すために出してきたので。「OpenAIは裏側でたくさんニュースをストックしておいて、他社が出した瞬間に上乗せする」と、シリコンバレーではよく言われています。

池田:なるほど。そういう戦略なんですね。

茶圓:中の人に話を聞いたことがあるんですけど、けっこうOpenAIはそういうマーケで勝ちにいくみたいな。やり方があんまり好かれてはいないって聞きましたね。

池田:(笑)。なるほど。

茶圓:今月もシリコンバレーへ行くので、そのへんも調査していこうと思います。そういったシリコンバレー日記も投稿しようと思うので、ぜひTwitterのフォローをお願いします。

池田:必見ですね。

茶圓:ありがとうございます。