AI × WEB YouTuberのKEITO氏が登壇

池田朋弘氏(以下、池田):セッション2つ目は、「圧倒的業務効率化を実現するために知っておきたい5つの生成AIツール」ということで、KEITOさんにお越しいただきました。KEITOさん、よろしくお願いします。

KEITO(以下、KEITO):はい。よろしくお願いします。

池田:知ってる方が多いと思うんですが、KEITOさんはYouTubeでインフルエンサーとして活動されておりまして、複数の企業の生成AI顧問をされています。また、画像生成AIを使って、地方創生を目的とするAIアートコミュニティ「SOZO美術館」など、いろんなプロデュースをされています。

私もけっこう画像や、ちょっと難しいプロンプトはKEITOさんの動画を見て学んだり、日々拝見させていただいています。よろしくお願いします。

KEITO:はい。よろしくお願いします。初めに、今生成AIの種類がすごく多くなってきたなと思っています。ジャンルで分けるとこんな感じかなと思います。

テキスト生成でいったら「ChatGPT」とか、資料作成だと「Gamma AI」とか。音楽生成、ディープフェイク、画像生成、画像編集、動画生成、文字起こしなど、いろんなのが出てきてるんですけど。今回は、いろんな生成AIツールの中から5個に絞って、現実的に使えそうなWebツールを主に紹介していきたいと思っています。

細かいところまで文字起こししてくれる「Gladia」

KEITO:まず1つ目は、こちらの「Gladia」ですね。池田さん、これは知ってますか?

池田:知りませんでした。

KEITO:あ、良かったです。これは動画を文字起こししてくれるサービスになっています。右側が実際の画面になってるんですけど。僕の最新の22分の動画を入れ込んだら、もう全文文字起こししてくれます。使い方は非常に簡単で、URLから文字起こしできます。しかも無料で使えるんですよね。多言語対応で30分程度とあって、22分の動画でもぜんぜん使えます。

実際に見てもらうのが一番イメージが湧くと思うので、見せますね。これが僕の動画を文字起こししたものです。僕が先日出した、「Create」っていうツールを紹介した22分の動画をすべて文字起こししたんですが、こうずらーっと書き起こしてくれるんですよ。

いろんな文字起こしツールがあるんですけど、これが一番クオリティが高いというか、細かいところまでちゃんとやってくれるイメージです。「ChatGPT」の「GPTs」のカスタムGPT、「My GPTs」でもYouTube動画を読み込んで、文字起こしできるんですけど。あれは全文文字起こししてくれないんですけど、こっちはわりとしてくれる感じがありますね。

他サービスよりも「Gladia」をすすめる理由

池田:動画(の文字起こし)だと「Notta」とか「Rimo」が、けっこうビジネスでは有名かなと思うんですけど。ああいうのに比べても、この「Gladia」が優れてるんですね。

KEITO:めちゃくちゃセンスがある文章を作ってくれるんですよね。「えー」とか「あー」とかも全部取ってくれますし。

池田:確かに、見た感じ文章はきれいですね。

KEITO:そうです。きれいなんですよ。

池田:この場合、文章がきれいかプレゼンがうまいかどっちかですよね。

KEITO:そうですね、僕のプレゼンがうまいのかもしれないですけど(笑)。しかも、これはすべての文章にタイムスタンプがついてるんですよ。実際に音で聞きたい部分を押せば、その箇所に飛ぶことができて、これがかなり使えるなと思っています。このサービスで何か事業を効率化したいと考えるなら、単純に情報収集とか。

あと「ChatGPT」を使って、この生成された文章を全部コピペして、文章を成形して。SNSとかブログに投稿するのはなんかあれですけど。上司に共有する際の文章を作る時とかには、すごく使えるんじゃないかなと思っています。

池田:今日は5時間ぐらいあるんですけども、このイベントに来た人は、たぶん業務時間中だと思うんで、ライブを文字起こししてもらって。「Claude」で文字起こししたものを要約するってことですよね。

KEITO:そうです。

池田:なるほどね。しかも無料なんですよね。

KEITO:そうなんですよ。

池田:こういう文字起こしサービスって、枠有りの有料が多いじゃないですか。

KEITO:そうです。

池田:(Gladiaも)キャンペーン中かなぁ。そのうち値上げしようと思ってるのかな。

KEITO:(Gladiaも)無料なのは月10時間までかな。

池田:けっこうあるなぁ。

KEITO:30分の動画だったら、20本ぐらいぜんぜんいけるんで、かなりおすすめですよね。

文字起こしツールを実務で活かすシーン

池田:いいですね。お恥ずかしながらちょっと質問なんですけど、僕は実はあんまり動画の文字起こしを使ってないんです。実は自分でも「Zoom」と連携したりとかして、文字起こしツールを作ってました。

いろんなサービスを提案はするんですけど、けっこうメモするだけでミーティングを終えちゃってて。あんまり動画の文字起こしを実務で使うシーンがないんですけど。KEITOさん、どういうシーンでこれを使われてらっしゃるんですか。

KEITO:僕の場合は、自分の動画を文字起こしして、自分のブログでテキストとして取っておくとか。

池田:なるほどね。それはいいですね。

KEITO:あとは、僕は今は会社員ではないんですけど。会社員時代だったら、こういう動画を見て「感想をまとめて上司に報告しろ」みたいな場面って、けっこうあったんですよ。そういう時にかなり使えるなと思いましたね。

池田:それはいいですね。

KEITO:あとこの「Gladia」は、API(接続先のOSを呼び出すことや、互いのソフトウェアやアプリケーション機能の一部を共有すること)もあるので。シンプルに、これを使って自社のシステムに文字起こしの機能をつけることもできるので。その点でもかなりおすすめですね。

池田:APIいいですね。なるほどね。すばらしい。

「HeyGen」を業務効率化に活用するポイント

KEITO:ということで、次は「HeyGen」ですね。これはけっこう知ってる人が多いと思います。具体的な(業務での活用)事例はまだ少ないですけど、1個見つけたので、後で話しますね。

この「HeyGen」を知らない人に向けて説明いたしますと、簡単にアバターを作成できるサービスです。この右側に僕が映ってるんですけど、僕が実際に動画でしゃべっている映像じゃなくて、僕の動画を元に作ったアバターがしゃべっているんです。これを「HeyGen」に作ってもらいました。

もちろん僕の映像以外に、そのへんの画像をアバターにしたりもできるサービスです。テキストを入力すれば、それを読み上げてくれます。この「HeyGen」の活用で業務効率につなげるとしたら、説明用の動画とかですかね。インフルエンサー的なファンを作るような動画には向いてないと思うんですけど。

池田:堅い感じの研修とか、企業の説明とかですよね。

KEITO:そうです。そのへんって、別に人柄とかはわりとどうでもいいと思っています。やっぱり内容がしっかり入ってくる、正確な情報を動画で伝えられるって部分だと思うので。アバターでもなんでもいいんじゃないかなって僕は考えています。そういう場面でかなり使えると思いますね。

池田:これ、可能性ありますよね。確かどなたかがAIニュースをこれで作ってましたよ。自分の(アバターを)「HeyGen」で作って、ニュースの原稿は「ChatGPT」で作り、(「HeyGen」に)読ませて動画にしていました。

KEITO:そうですよね。ああいうのもすごくいいとは思うんですけど、でもYouTubeとかSNSでの活用は、イマイチな感じはしますね。

池田:そうですよね。これを使ってYouTubeを出すかと言ったら、俺はたぶん出さないです。自分で話したほうが早いし、なんか生身な感じがあると思うんで。そこは当然そうですよね。

KEITO:うん。でも、解説とか説明にすごく向いていると思っているので。そのへんの動画を作る場面があるならば、これは台本だけ作れば動画が完成するんで、かなり効率化するんじゃないかなと思います。

池田:確かに。多言語なのはいいですよね。自分の声で流暢に英語をしゃべってるふうになるじゃないですか。

「HeyGen」を活かせる業務、向いていない業務

KEITO:そうです(笑)。これは実際に僕がアバターにしたやつなんですけど、1回流しますね。

KEITO(アバター):Hey, KEITO. Your instant avatar is ready. Feel free to create videos today. Also, click the feedback button to share what your think. hope you enjoy. 

KEITO:……という感じですね。

池田:めっちゃ流暢じゃないですか。しかもあきらかにこれ、(AIが)自分の声を学んでますよね。

KEITO:声、学んでると思いますね。

池田:以前に、「HeyGen」がOpenAIのAI音声技術の「Voice Engine」を採用しているってあったんですけど。半年ぐらい前から、「HeyGen」に関しては、「音声が自分の声の感じになってるな」と思い……。あれって、裏側で(音声を)入れ替えて、その人の音声を再現するって感じなんですかね。

KEITO:そうですね。正確ではないんですけど、たぶん「ElevenLabs」と提携してるのかなと思って。

池田:裏側でね。いや、けっこう本当に声もそれっぽいよなぁ。

KEITO:そうなんですよ。“AI Voice”ってメニューで、いろんな声をカスタムして作れるんです。このアバターを作る必要もなくて、ナレーションとして利用したいシーンでも「HeyGen」は使えますね。

池田:事例は確かにあんまり(挙げられないかもしれない)ですが、概念はおもしろいなと。研修でよく自分も話してるんですけど、業務で使ってるかと言うと、使ってないです。

KEITO:たぶんクライアントワークで使う場面は少ないとは思いますけど、こういう社内でのメッセージとか……。でもメッセージでも微妙かもしれないですね。

池田:「AIがこれから世の中を変えるぞ」っていうメッセージですよね。これを流して「実はAIでした」っていう。「このスピーチの原稿はChatGPTで作りました」って、一時期流行ったじゃない。そういう演説のパターンですね。

KEITO:はい。そういうのでも使えると思いますね。おもしろいと思います。

池田:おもしろい。確かに。