エキスパートが解説する「Generative AI」とは

小川りかこ氏(以下、小川):それでは12時になりましたので、「01 Expert Pitch」第21回を始めてまいります。「シリコンバレー発! 世界のエキスパートが最新情報を日本語で解説」ということで、本日は「世界に衝撃! Generative AIとは?」をお送りいたします。

さて、今回はbtrax, Inc., Founder & CEO・Brandon K. Hillさんをエキスパートとしてお迎えしております。Brandonさーん!

Brandon K. Hill氏(以下、Brandon):よろしくお願いします。

小川:どうぞよろしくお願いいたします。そして本イベントの主催者のTomorrow Access, Founder & CEOの傍島さん。本日もよろしくお願いいたします。

傍島健友氏(以下、傍島):よろしくお願いいたします。

小川:そして私、ナビゲーターを務めるフリーアナウンサーの小川りかこと申します。どうぞよろしくお願いいたします。それではさっそくですが傍島さん、この01 Expert Pitchの狙いなどを少しお話しいただけますでしょうか。

傍島:あらためまして、Tomorrow Accessの傍島と申します。よろしくお願いいたします。Tomorrow Accessという会社はシリコンバレーを拠点にしたコンサルティング会社になります。

この01 Expert Pitchなんですが、今回は21回目で、なんと478名のお申し込みをいただきました。多数の方にご参加いただいております。ありがとうございます。

こちらのExpert Pitchの狙いは3つあります。1つ目は「日本とアメリカの情報格差の解消」ということで、今回テーマにしているGenerative AIのような新しいテクノロジーが出てくるたびに、日本の企業の方から「その情報はどうなってるんだ」「最新のトレンドは何だ」みたいな話をたくさんいただくんですよね。そういった声に迅速にお答えをして、日本とアメリカの情報格差を埋めたいのが1つ目の狙いです。

2つ目は「正しい情報をお届け」したいということで、同じニュースでもアメリカで感じている温度感と、日本に伝わってる温度感が違うなと感じることがあるんですね。

つい先日も、シリコンバレーバンクのニュースが日本でも流れたと思うんですけれども、シリコンバレーなどの界隈ではすごくてんやわんやしていました。すごいニュースだったんですが、日本の人たちの反応を見てると「そうでもないのかな」なんて感じることがあります。

そういった時に、今回ご登壇いただいているBrandonさんのようなエキスパートの方にきちんと解説をしていただいて、正しい情報をお届けしたいのが2つ目の狙いです。

3つ目は「日本語での解説」ということで、英語の情報をたくさん集めればいいということでもあるんですけれども、なかなか大変です。日本語できちんと解説をしていただいて、正しく理解していただこうと。この3つの狙いでウェビナーを運営してまいりました。

今日も本当にいいタイミングで、ここ1~2週間ぐらい目まぐるしいニュースが毎日届いてきています(笑)。私も非常に楽しみにしてまいりましたので、どうぞよろしくお願いいたします。

小川:傍島さん、ありがとうございます。本日のイベントはみなさまからのご質問を随時受け付けて進行を進めてまいります。参加者のみなさま、ぜひBrandonさんにご質問のある方は、Zoom画面の下にあるQ&Aボタンから、ご質問をお寄せください。随時私で拾ってまいりますので、どうぞよろしくお願いいたします。

Generative AIとはどのようなテクノロジーなのか

小川:それではBrandonさん、まずは簡単に自己紹介からお願いしてもよろしいでしょうか。

Brandon:簡単に言うとbtraxはデザイン会社です。今僕がいるのはサンフランシスコの本社オフィスなんですが、デジタルを中心にUXデザインやサービスデザイン、そのマインドセット醸成のための企業向けのワークショップをやったりしています。

そのほかにも、日本の企業の海外進出向けのプロダクト作りとブランディングをやったり、アメリカ企業や海外の企業の日本向けのプロジェクトをやったりして、拠点はサンフランシスコと東京の南青山にあるかたちです。

さっそくスクリーンをシェアしながら、今日のお題を進めさせていただければと思います。Generative AIの話をします。ちゃんとした自己紹介のスライドはあまりなかったので、今回自分がやってることをまとめてみたら、意外と起業家のメンタリングとかサービスに関してのアドバイザーをしているなと思って、バッと載せてみました。

傍島:多いですね、すごいですね(笑)。

Brandon:集めてみたら、なんか多かったですね。

傍島:さすがです。

Brandon:とんでもないです。あ、そういえば、今回のプロフィール写真は、画像をAIで作ってみたんですよ(笑)。

小川:すてきですね。

Brandon:何かというと、今まである自分の写真を20〜30個、バーッとアップロードしたら、自動的に違うシチュエーションの絵や写真を作ってくれるみたいなサービスです。1週間ぐらい前にこのスライドを作る時に試してみて、こういうのが出てきたのでちょっとおもしろいかなと思って(笑)。

小川:かっこいい。インスタでもすごくはやってて、みなさんアップされてますよね。

Brandon:そうですよね。それのもっと進化した版みたいなので、シチュエーションも自分で決められるものがあります。のちほど説明しますね。ちょっとした小ネタでございます。

小川:ありがとうございます(笑)。

Brandon:btraxの堅苦しい紹介は飛ばしておきます。今日は(スライドを示し)こんな内容で進めさせていただければと思います。Generative AIに関しての一般的かつ基本的な話というか、非常に初歩的な部分が多いので、詳しい方からすると「そんなの知ってるよ」となるかもしれないんですけど、ちょっとお付き合いいただければと思います。

途中でクイズタイムで、写真がリアルか生成したものかというクイズをやって、仕事に対する変化についてもお話しします。具体的に我々がbtraxとしてAIをどのようにデザインの現場で使ってるかという話もさせていただければと思います。ゴールとしてはこういったことがわかればいいかを目標にしてる感じですが、いかがでしょうか。

小川:すごく楽しみです。ぜひ引き続きお願いいたします。

Brandon:わかりました。いつでも止めてくださいね(笑)。

(一同笑)

組み合わさって新しいものが作られる「生成系AI」の技術

Brandon:ではさっそくですが、英語で言うと「Generative AI」って言うんですけれども、日本語では「生成系AI」などと呼びます。世の中で知られているのは、できたばかりのテクノロジーなので、呼び方がいくつかバラバラになってるのかなと思っています。

漢字で書くこともあれば、カタカナで「ジェネレーティブ」と書いてることもあれば、アルファベットで書いてるケースもありますよね。文字数が少ないので「生成系」と書くのが楽かなと思って、今回はそうスライドに書いてることが多いですね。

分解すると「Generate」という英語と「AI」。これは「生成する」という動詞と「人工知能」で、それを合わせて「Generative AI」と呼んでいます。生成するようなAIという、基本的な話なんですね。

(スライドを示し)とある映画のワンシーンの写真なんですが、わかる方いらっしゃいます? 相当古いんですけどね。

傍島:何でしょう。

Brandon:1980年代の映画で『The Fly』という、ハエ男になるというホラー映画があります。ポッドAからBに移動する時に、間違って人とハエが一緒に入っちゃって、それが組み合わさって新しい生物ができたという。

小川:怖いですね(笑)。

Brandon:まさに生成されたので、イメージ的には「いろんなものを混ぜ合わせると新しいものが生み出される・変換される」感じかなという。生成系AIをすごく単純にブレイクダウンすると、そういうことかなと思います。

実際、どんな感じになるかをお見せしますね。例えば、サンフランシスコという僕がいる街なんですが、対岸から見た写真です。下の絵はモネという印象派の画家です。もしモネがサンフランシスコのこういう写真をもとに、ここから絵を描いたらどうなるかをAIに指示すると、(スライドを示し)こういうふうに出力してくれるんですね。

小川:すてきですね。

Brandon:モネはサンフランシスコにたぶん来たことないので、この絵も存在してないんですけれども、AIがそれを考えてくれてモネがこの絵を描いた感じになっています。

これは、スティーブ・ジョブズのスピーチ動画をAIに読み込んでもらって、ChatGPTという、文字で質問したら文字で答えるのを合わせて音声出力した場合にどうなるかを試しに作った人の例ですね。

(スライドを示し)質問するとこんな感じなんですよ。ジョブズは何の話をしているかというと、コロナのパンデミックで世の中にすごく影響が大きかったという話をしています。

彼はもうずいぶん前に亡くなられているので、コロナ禍を知らないじゃないですか。だけど、声を聞くとジョブズのスピーチですよね。ジョブズがしゃべってるように聞こえるわけですよね。

これはいくつかのAIがつながっていて、ChatGPTというなにか質問したら答えてくれる人工知能のテキストと、スティーブ・ジョブズっぽくしゃべるAIを合体させたことで、スティーブ・ジョブズが「パンデミックはどうだった」「Appleも大変だった」みたいな返事をすると(笑)。AIジョブズみたいなものを作ったケースですね。これはけっこうインパクトがあるかなと思いますよね。

傍島:確かに、ずいぶん前にジョブズは亡くなっていますもんね。パンデミックの話なんかできないはずですよね。

Brandon:そうですよ。降臨した感じがしますよね(笑)。こういうこともできちゃう例ですね。

インターネットができてから現在に至るまでの変革期

Brandon:Generative AIの話をする時に、あまりにも革命的すぎちゃって、今我々がどこにいるのかを見失いがちです。そこで、インターネットができてから現在に至るまでの、変革期を説明させていただけるとありがたいかなと思ってます。

まず1990年代頃からインターネットが世の中に普及したんですけれども、最初って世の中の人は「リンクをクリックして情報にたどりつく」というブラウジング方法でした。一般的なのは、Yahoo! JAPANの一番最初の頃のページは、検索よりもリンクをクリックするサイトだったんですね。

今でもアメリカだとCraigslistやWikipediaもそうですよね。リンクをクリックしていってたどりつくハイパーリンクが最初のインターネットの使われ方だったと思うんですけども。

そこから情報があまりに集まりすぎて「クリックしてるとキリないよ」となったので、みなさん検索をし始めました。みなさんもGoogleを毎日使ってると思うんですけど、世の中にある何百億、何千億という情報から自分の欲しいものを探す時に「クリックじゃ時間ないので、検索で結果出して」みたいになっていったと思うんですね。それが2000年前後から最近までだったと思います。

ここで2023年になりましたけど、ついに対話型・生成型で情報を引き出してゲットするというシフトがきた、第三期に入ったぐらいの始まりに我々はいるかなと僕は感じていますね。

傍島:大きいですよね。Web1.0、2.0、Web3なんて話も、前にもウェビナーで取り上げました。本当に第三期に入ってきた感じですよね。

Brandon:そうですね。世界全体がインターネットを介して情報を獲得する手段が大きく変わってきた感じですし、実際にここ数日でGoogleの検索量も格段に下がってるニュースも見たんですよね。そのぐらい影響がある状況かなと思います。

生成系AIで作れるもの

Brandon:Generative AI、生成系AIはどういうことかを簡単に言うと「文字や画像等を入力してAIに生成させる」ことです。ここで「何を生成するの?」が、次のクエスチョンだと思います。これぐらいは今はもうできちゃってますね。文章、画像、動画、ゲーム、Webサイト、アプリ以外にもたぶん今後できてくると思うんですけど、余裕で今できている状態になってます。

例えばこれは文章ですね。これは僕が「ドクターにアポ取りたいんだけど、アポメール書いて」と言ったら書いてくれました。画像、絵も描いてくれました。

あとは動画ですね。これはフレームバイフレームという、静止画をつなげてはいるんですけれどもAIで動画が作れ始めてますね。

これはゲームです。テトリスも作れたり、WebサイトもAIで作れたりします。あと、これはアプリを作った方が先週ぐらいにいたんですけど、「映画アプリみたいなものを作って」と言ったらコード書いてくれて、それで生成された例ですね。

小川:すごい(笑)。

傍島:もうコードとか勉強しなくていいってことですよね。本当に「こういうゲーム作って」「こういうWebサイト作って」と書いたりして教えればいいわけですよね。

Brandon:そういうことになるんですよね。なので簡単に想像するだけでも世の中と仕事の仕方や役割が変わるだろうなって、後半でちょっと説明する予定でございます。

1回まとめると、AIが既存のデータから新しいデータを生成して、リアルな画像や動画、文章などを作成するテクノロジー。生成系AI、Generative AIということになります。

重要なキーフレーズ「プロンプト」

Brandon:ここで重要なキーフレーズが、うちのCTOに3週間ぐらい前に「プロンプトが大事だよ」と言われたんですよね。

傍島:よく聞きますよね。小川さんはどうですか、「プロンプト」って聞いたことあります?

小川:いや、ちょっとわからないですね、まだ……。

傍島:たぶんわからないですよね。

Brandon:プロンプトは難しそうでぜんぜん難しくないですね。AIに「何かしてください」と入力する指示です。スライドはChatGPTに「どういうふうにプロンプト書いたらいいですか?」と聞いたら、こういうふうに答えてくれたという(笑)。

小川:それさえも聞いてしまうと(笑)。

Brandon:ChatGPTが「私にはこういう指示をしてくれれば動きやすいですよ」と言ってくれた例です。プロンプトからのアウトプット。

次は画像いきますね。今は英語が中心なので、こういうふうに「food photography, hamburger in the style of a McDonald’s big mac…」とか書いてるんですけども、こういうのを生成してくれると。

小川:うーん、おいしそう。

Brandon:あとは今度は人の写真を、「Fujifilm」とか「こういうカメラっぽい写真でお願い」って言うと、リアルに生成してくれたりします。おもしろいと思ったんですよね。「Joe biden and donald trump laughing and playing golf together」という。

傍島:ないない(笑)。

Brandon:リアルではあり得ないことを、言ったら作ってくれるという(笑)。

小川:すごい、楽しそうですね(笑)。

Brandon:これは正しい使い方かなと思っちゃったりしたんですよね(笑)。リアルではありえない世界が表現できます。アメリカ的にはけっこうヒットだったんですけど、こういうのも作ってくれます。スケッチを描いて「こんな感じの写真」と、合わせてAIに頼むといい感じのグラフィックデザインをしてくれます。

小川:すごくかわいいなと思いました。

Brandon:かわいいですよね。今はグラフィックデザイナーとかに「こういうのが欲しいです」とクライアントさんがリクエストする時に「ちょっと簡単にスケッチ描いてみました」「この写真っぽい感じで」と言って渡したら、グラフィックデザイナーが10時間、20時間、30時間かけて、スライド右の画像みたいなものを「どうですか」と出すのを、AIさんが1分くらいで出してしまった例です。

傍島:左上のハガキにも見えないような手書きが右側になるんですよね。すごく意味があることだと思うんですよね。手書きを上手に書く必要がないんですよね。まったく似せる必要もない。「なんとなく」でこれはすごいなぁ。

小川:本当に誰でも作れちゃいますよね。

Brandon:AIの気遣いによって作ってくれるという(笑)。

傍島:「いい感じで」って感じですね(笑)。

Generative AIの苦手なもの

Brandon:あとは意外と見落としがちなんですけど、画像から文字に変換できるんですよね。画像を読んでくれて、そこからいい感じで文字を出す。スライドがいい例なんですよね。「この写真の食材で作れる写真のレシピ作って」と言ったら、レシピを出してくれる。

小川:主婦としては最高ですよ(笑)。

Brandon:最高ですよね。逆ディレクションで写真をもとに文字コンテンツを生成するのも、もうすでにできている状態でございます。うちのCTOがこれも教えてくれたんですよね。「『こたつにみかん』がAIは苦手なんだよね」と言われたんですよ。

Generative AIには苦手なものもあるんですよ。それはカルチャー的なコンテキストが現時点ではそこまで強くないということです。「こたつにみかんを置いた画像出して」と言うと、がんばってくれます。こういう感じで、できる限りやってくれてるんですけど(クオリティが)ぜんぜん……。

傍島:(笑)。

小川:夢の世界のようですね(笑)。

Brandon:(笑)。こたつが何かというのと、お正月のあの雰囲気というコンテキストをAIさんがまだ学びきれてない。

小川:ご存じない感じですね。

Brandon:これもたぶん日に日に改善はすると思います。おもしろい例なので出てましたね。なのでプロンプトって、英語でも日本語でも言われるのが「AIに何かを作ってもらうためにお願いする時に使う『呪文』」と言われてるんですよね。今、けっこう詳しい人は「すごいプロンプト考えたぜ」って言って自慢してる、みたいなのが最近出てきましたね。

どうプロンプトを入力するかによって生成される・出力される内容が変わってくるので、正しいプロンプトの書き方を覚えるために今、世界中の方がプロンプトの書き方を身につけようとがんばってる。呪文の唱え方を勉強してる方が僕を含めて今増えてますよね。

指示の仕方によって結果が大きく変わる

傍島:この指示の仕方によってぜんぜん結果が変わるんですよね。呪文の唱え方によってぜんぜん違うんですよね。

Brandon:ぜんぜん違うんですよ。それで言うと、ほかの方々がポストしてたのをちょっとお借りして名前も載せてますけど、こういう感じでプロンプトを作成するポイントはあります。(スライドを示し)こういう感じとか、これは良くない例です。

「こういう書き方をするといい」というのはポストされてましたので、簡単にご紹介したところでございます。

傍島:今のを見てると、すごく丁寧に論理的に1個ずつ説明したほうがいいですよね。

Brandon:傍島さん、人と人のコミュニケーションとか、上司が部下に指示する時もそうしてほしいという話なんですよ(笑)。

傍島:確かに(笑)。

小川:細かく、わかりやすく(笑)。

Brandon:最近、プロンプトを勉強してるエンジニアの方もコミュニケーション能力がめっちゃ上がってるんですよ(笑)。

傍島:確かに、ありますよね。僕たちってたまに日本語を英語に通訳みたいなことをしなきゃいけない時もあるんですけど、しゃべってる日本語が聞いててわかんない時があるんですよ(笑)。「何しゃべってんだっけ」って、しゃべってる人もよくわかんないみたいな。

Brandon:日本語は主語が抜けてたりしますからね。

傍島:そこを一つひとつ丁寧にやるのがポイントですね。

Brandon:ちゃんとやるという。そうすると人とのコミュニケーションもより良くなるというのが今、世の中でけっこう起こってる、うちの社内でも起こってることですね。「あれ? なんかあの人説明わかりやすくなったな」と思ったら「ちょっと今、プロンプト勉強してまして」みたいな(笑)。

傍島:確かに、いいことだ(笑)。