動画の内容を解析してくれるAIも

茶圓:あとは、マルチモーダルでいくと画像解析ですね。まさにさっきの事例みたいな感じですけども、写真を上げたら、しっかり画像から中の内容を解析する感じです。動画の解析も徐々にできてきていて、今みなさんが簡単に使えるのでいくと、やはりGemini 1.5 Proは、動画のアップロードができるんですよ。

「今までもAIで動画アップはあるじゃん」と思うんですけど、あれは実は動画の音声を文字起こしして、その文字を分析しているだけであって、動画自体を見ているわけではないと。

動画を見ると何ができるかと言うと、この前僕は筋トレした動画を上げたんですよ。そうすると「肘が曲がっている」とAIが言ってきて、「じゃあお前がやれよ」と思ったんですけど。そういうことができるので、本当に人間の目で見るように分析してくれるんですね。

池田:なるほど。1.5 Proって、普通に申請したら誰でも使えるんでしたっけ? 

茶圓:誰でも使えますよ。API(Application Programming Interface:接続先のOSを呼び出すことや互いのソフトウェアやアプリケーション機能の一部を共有すること)も開放されていて、そんなにべらぼうに高くはないです。しかも今、プレビュー版はなぜか無料なんですよね。

池田:そうなんですね。へえ。

茶圓:使わない理由はないので、使ったほうが絶対にいいです。これはAIの価格と精度の比較表です。Gemini 1.5 Proはないですけども、GPT-4はけっこう高いですね。

池田:1.5 Proは日本語もいけるんでしたっけ? 

茶圓:もちろんです。日本語も対応してます。

池田:なるほど。すばらしい。

茶圓:ちょっと見つからないですけど、また見つけたら共有します。

池田:ありがとうございます。

茶圓:めちゃくちゃ高くはないので。そのへんも「LLM Pricing」とかのまとめサイトがあるので。開発者目線ですけども、開発する際に何を使うかの時に、こういうトークンの価格表は見たほうがいいなと思います。

開発者目線ではChatGPT-4が圧倒的

茶圓:あとは、Claudeはすごいとか言われるんですけども、開発目線だと、やはりChatGPT-4が圧倒的。Function callingとか、要は他社、他のアプリと連携する機能があるので。結局Claudeはそういうのがなかったり、最近出ましたけど、まだ弱かったりもするのと。

あとはトークンとかリクエストにリミットがあるので、いわゆる「requests per minute」(1分あたりに利用できる上限値)ですね。RPM(1分の間での回転数)やTPM(生産現場全体で協力して生産保全を行う考え方)とかが、まだ弱かったりもするので。そのへんを見て、総合的に判断したほうがいいかなというのが、私の所感でございます。

池田:なるほど。

茶圓:ちょっとしゃべり過ぎましたけど。

池田:ありがとうございます。

茶圓:そんな感じでトレンドをまとめると、ここ数年は劇的な変化はないかなと思っています。2022年から盛り上がったんですけど、「意外とできることはそんなに多くないよね」となっていて。

より細かいファインチューニングとか、RAG(検索により強化した文章生成)を使ってがんばってLLMを自社用途に改造して、いろんな領域でサービスができてくるかなという印象です。なので、愚直に企業導入が進むと思っています。

2027年ぐらいからは、より大きな長期的タスクができたり、もっと長い動画の生成とか、先ほど話したコードを含んだ出力ができるようになっていくのかなと。10年後にはAGI(人工汎用知能)誕生で世界が変わってくる。ここはもっと指数関数的に早く進化していくと予想しています。

議事録を作る時に使える文字起こしツール

茶圓:ここまでがざっとトレンドの話です。残り15分くらいなので、私がふだん使っているAI活用法を話そうかなと思っています。

池田:気になりますね。

茶圓:ただ、話したいことがたくさんあるので、いったん「ChatGPTはすごいよ」というこの表と。今回のセミナーに来ている方は、恐らくみなさん使っていると思うんですけど、GPT-4のほうが圧倒的に性能が良いし、いろんな機能が使えますよと。

YouTubeもやっているので、もしよかったら「AIスクール」で検索いただけると。最近更新はゆっくりですけども、そのへんも解説もしています。時間的に全部デモはできないので、一番おもしろそうなのを出すと、やはり議事録作成が最強ですね。今回はClaudeを使おうかなと思います。

「基本的に仕事はClaudeか、自社のAIツールを使っています」という方が一番感動するのは、議事録をAIで全部文字起こしするところ。これはけっこうみなさんからご好評をいただいています。

例えばこれは「tl;dv」という別の(文字起こしの)ツールなんですけども、ちょっと使ってみます。こんな感じで、打ち合わせをZoomでやったら、話者を識別して全部文字起こししてくれます。これをもとに一応議事録も作ってくれますが、なかなかこれは精度が低いので。

私の場合はこれを全部コピーして、Claudeに貼り付けます。「tl;dv」はたまにコピーの反応が悪かったりするので、連打をして貼ります。次はプロンプトを入力するんですけれども、そこは私が日々メモしているプロンプトを(入れます)。

今回のセミナーのアンケート特典として、私がふだん使っているプロンプトを送らせていただくので、ぜひ最後まで聞いてもらえたらと思います。例えばこんな感じで入力しておいたら、完成ですね。

日本企業でAI活用が進まない理由

茶圓:ただ、けっこう私はいろいろ使っているんですけど、毎回プロンプトを持ってくるのは面倒くさいので。自社でも企業向けの、セキュリティが安全なChatGPTを作っていまして、けっこうそれを活用することも多いですね。

池田:さっきおっしゃっていた、(企業で)作って導入されているツールを、自分たちでも使っている感じなんですかね?

茶圓:そうですね。自社で企業向けのChatGPTを作っている感じです。これをお客さんに展開してあげて。でも日本企業が(AI活用が)進んでいない理由として、セキュリティ問題で導入できていないところが多いので。

そこを弊社はAzure(マイクロソフト社が提供するパブリッククラウドのプラットフォーム)で閉じたり、サーバーを日本に置いたりして工夫しています。入力、アップしたファイルも学習されないようにしていますので、安全な環境に置くことを意識しています。

これは弊社のツールで、右側を押すとプロンプトがたくさんあります。「議事録」と押して、さっきの議事録を入力したら一瞬で完成します。今は基本、このClaudeを使うか、自社のAIツールも「GPT-4 Turbo 128K」を使っているので、最大で10万文字ぐらい学習できます。

普通のChatGPTはだいたい3万2,000トークンなので、2万文字ぐらいしか入力できないんですけども、より多くの文字を入力できます。こんな感じで一瞬でサマリーも出してくれるので、議事録はけっこう楽に作れるかなという印象です。

あと、弊社のツールもAzureで閉じつつも、一部出ますけども、ClaudeとかGemini 1.5 Proも対応予定でして、いろんなAIを使えるサービスにしていく予定です。

プロのライターも顔面蒼白になったAI活用術

茶圓:他の事例でいくと、対談記事の作成とかもすごく喜ばれますね。この前、私はとあるメディアから起業家としてインタビューをされました。スマホで無料で使える「CLOVA Note」ってものがあるんですけど。オフラインの録音でしたら一番精度が高くて、ぽちっと押すだけで、ちゃんと話者も識別して全部文字起こししてくれます。

これを押してテキストファイルをダウンロードします。その後に、対談記事のプロンプトを貼り付けまして、この起業家インタビューをぽちっと押して、アップした瞬間に記事完成です。わざわざライターさんが来てヒアリングされていたんですけど、取材が終わった瞬間に僕がこれを作ったから、ライターさんは顔面蒼白で「僕の仕事がなくなる」と言っていましたね。

池田:確かに(笑)。

茶圓:もちろん最終の校正は必要なんですけども。デジタル系の記事作成も1日10件とかこなせるので、いいなと思います。

池田:うちの別にやっている会社で、海外の方にインタビューとかしたんですけど、ClaudeとGPT-4を比較したら、社内的には「今のところはClaudeのほうがいいんじゃないか」という感じでしたね。

茶圓:やはり日本語の出力は圧倒的にClaude 3 Opusが最強ですが、やはりGPT-4からしたらトークン料が高いので、開発で使うとなったら、(懸念するのは)そこぐらいですかね。

池田:Opusは確かに高いですね。

一瞬で人事評価のシートを作成できるツール

茶圓:あとは、人事評価を作ったりもしますかね。これは経営者に意外と刺さると思うんですけど。こんな感じで入力してあげます。

「あなたはプロの人事評価制度のコンサルタントで、以下の条件をもとに、具体的な定性と定量目標を考えてください」と。定性目標は最低4つで、定量目標は最低3つで、6段階とか。自分の職種を入力してあげると、こんな感じで一瞬で人事評価のシートを作ってくれたりもするので、これはけっこう喜ばれている印象ですね。

あとはメール作成、文章の添削と。こんな感じで一瞬でできます。私は昔、人事評価制度のコンサルの仕事をしていたんですけども、当時これがあれば無双できたなと思いますね。

池田:確かに。

茶圓:普通これを考えるのは大変で、コンサルに頼むとやはり何百、何千万円かけているので。もっと運用とかの付加価値はあるんですけども、こんなことができます。あとは、文字の添削は結局かなり使いますね。

例えばこんな感じで、今からまたプロンプトを貼りますと。ここで元の文章を貼り、「この間違いを指摘して」と言います。「元の文章の誤字・脱字と語尾の不統一を修正してください」と言うと、まず修正したものを出してくれます。その後に、どこを修正したかも細かく出してくれたりしますので、文字添削にも使ったりします。

メールはほとんどAIに書かせている

茶圓:あとはメールですかね。修正前・修正後で、「思うです」「思います」とか、「機体しています」と「期待しています」とか(の間違いを確認します)。人間のチェックも限界があるので、先にAIにチェックさせる感じでよく利用しています。

最後にメールのデモをお見せします。メールはAIが最強で、私はほとんどAIに書かせていますね。例えばメールに関しては、こんなプロンプトをいつも打っています。

「あなたはビジネスライターで、以下の条件をもとに、相手の返信を参考にしながら、メールを書いてね」と言います。ここに相手の返信を貼り付けてあげます。これは私が前にインタビューを受けた時のものです。

対談動画を撮りたいと言うことで、撮影の日程と、「事前打ち合わせをしたい」と(いう内容のメールが)来ました。私は敬語を書くのが苦手で面倒くさいので、音声入力で「先日はありがとうございました。次回撮影日程オッケーです。事前打ち合わせは来週月曜ランチでお願いします」と言うだけで完成。ぺたっと(相手の返信を)貼って、音声入力で終わりです。

あとは、相手の会社名も識別してくれます。ここの「今井さん」というのもうまく読み取って、自分の社名もちゃんと理解していますね。「先日は撮影ありがとうございました。次回撮影もオッケーです。次回ランチでいかがでしょうか」と書いてくれるので、コピーで完成。こんなふうにAIで無双できると思います。

池田:すばらしい。メールの返信といった場合に、最後の趣旨がないと意味のない返信になるじゃないですか。「自分の言いたいことじゃないんだよね」みたいな。基本的には中身は(自分で)作っていて、(AIは)整えてくれているだけというか。だからこういうのは重要ですよね。

茶圓:本当にそうなんですよ。プラス、相手の返信も加味して、私の雑な口頭での指示を入力するだけで作ってくれるので、時短オブザ時短という。そうなるとGMOさんみたいに、1人当たり1日2時間、3時間の(業務時間)削減も可能になってきます。

池田:いや、すばらしい。ありがとうございます。