リアルと見紛うほどに精巧な生成AIの「矛盾」を見抜くには　フェイク画像にだまされないために覚えておきたいテクニック

クオリティが格段に上がった、音声や画像の生成AI

池田朋弘氏（以下、池田）：（高桑さんは）全自動でPodcastを作っていて、文章やコンテンツもガンガン作っていると思うんですけど、これはどうですか？　

高桑宗一郎氏（以下、高桑）：まさに僕も当てはまっていますね。Podcastの台本が10分尺だとすると相当な文章量ですので、繰り返し使うところでは（生成AIを）使っています。

「成形」というワードがありましたが、文章以外で使うシチュエーションとしては、インプットの時に全体図を把握したい場合や、それぞれの要素の因果関係を体系化して理解したい場合ですね。読書のような、ものすごく自由に寄り道できるバージョンでもよく活用しています。

散歩していて「なんで高速道路の蛍光灯はオレンジなんだろう」と思った時や、そこから発展したことなど、体系的に聞きたい時は全部生成AIに聞いていますね。

池田：すばらしい。使いこなしていますね。では次に行こうと思います。文章以外の生成AIの話ですね。まず2023年は音声がヒットしたかなと思っています。

スマホのアプリが出たのが2023年の5月だったのですが、音声入力でパッと聞けるのはすごく楽なんですね。ちなみに先ほどの高速道路の（蛍光灯の）話は音声ですか、それとも自分で入力するんですか？

高桑：音声ですね。

池田：そうですよね。音声のほうが楽かなと思います。外にいる時や移動中、あとは考えが整理されていなくて文章にするのが面倒くさい時や、疲れていてパソコンで入力したりスマホでフリックしたくない時に音声はすごく楽だなと。

あとは画像です。2023年の1月（時点）ではMidjourney（ミッドジャーニー）という画像生成AIはV4でしたが、今はV6になっています。これは同じプロンプトなんですが、リアリティが格段に違いますし、クオリティもまったく違います。

また「Flat Illustrationで世界地図っぽいのを描いてくれ」と言った場合、V4もけっこうクオリティが高かったんですが、V6はリアリティも洗練されているレベルも違うなと。画像もすごく良くなったなと思います。

AIの進化で、精巧なフェイクニュースが作れる時代に

池田：これは映像ですけど、上が新しい動画生成AIで下が昔のバージョンです。昔のもすごいんですけど、やっぱり新しいバージョンになってくるとリアリティのレベルが違います。下は「生成AIだな」という感じですけど、上は「あれ？　本物？」となっています。このあたりの精度のレベルは、1年間だけでもガーっとクオリティが上がったなと、さまざまなところで思います。