2024.10.10
将来は卵1パックの価格が2倍に? 多くの日本人が知らない世界の新潮流、「動物福祉」とは
リンクをコピー
記事をブックマーク
株式会社FIXERが主催した本イベントでは、2023年の生成AIトピックスを振り返りながら2024年のトレンド予想や活用方法について語られました。本記事では、「ChatGPT最強の仕事術」著者の池田朋弘氏と、株式会社FIXERプロンプトエンジニアの高桑宗一郎氏が、音声や画像の生成AIの進化についてお話しします。
池田朋弘氏(以下、池田):(高桑さんは)全自動でPodcastを作っていて、文章やコンテンツもガンガン作っていると思うんですけど、これはどうですか?
高桑宗一郎氏(以下、高桑):まさに僕も当てはまっていますね。Podcastの台本が10分尺だとすると相当な文章量ですので、繰り返し使うところでは(生成AIを)使っています。
「成形」というワードがありましたが、文章以外で使うシチュエーションとしては、インプットの時に全体図を把握したい場合や、それぞれの要素の因果関係を体系化して理解したい場合ですね。読書のような、ものすごく自由に寄り道できるバージョンでもよく活用しています。
散歩していて「なんで高速道路の蛍光灯はオレンジなんだろう」と思った時や、そこから発展したことなど、体系的に聞きたい時は全部生成AIに聞いていますね。
池田:すばらしい。使いこなしていますね。では次に行こうと思います。文章以外の生成AIの話ですね。まず2023年は音声がヒットしたかなと思っています。
スマホのアプリが出たのが2023年の5月だったのですが、音声入力でパッと聞けるのはすごく楽なんですね。ちなみに先ほどの高速道路の(蛍光灯の)話は音声ですか、それとも自分で入力するんですか?
高桑:音声ですね。
池田:そうですよね。音声のほうが楽かなと思います。外にいる時や移動中、あとは考えが整理されていなくて文章にするのが面倒くさい時や、疲れていてパソコンで入力したりスマホでフリックしたくない時に音声はすごく楽だなと。
あとは画像です。2023年の1月(時点)ではMidjourney(ミッドジャーニー)という画像生成AIはV4でしたが、今はV6になっています。これは同じプロンプトなんですが、リアリティが格段に違いますし、クオリティもまったく違います。
また「Flat Illustrationで世界地図っぽいのを描いてくれ」と言った場合、V4もけっこうクオリティが高かったんですが、V6はリアリティも洗練されているレベルも違うなと。画像もすごく良くなったなと思います。
池田:これは映像ですけど、上が新しい動画生成AIで下が昔のバージョンです。昔のもすごいんですけど、やっぱり新しいバージョンになってくるとリアリティのレベルが違います。下は「生成AIだな」という感じですけど、上は「あれ? 本物?」となっています。このあたりの精度のレベルは、1年間だけでもガーっとクオリティが上がったなと、さまざまなところで思います。
これは「HeyGen(ヘイジェン)」という人間のアバターを自分の映像から作るものです。(スライドは)私のAI映像なんですけど……1分くらいの動画を撮って1回学習させると、このテイストの動画が無限に作れるサービスです。
さまざまな領域で音声入力ができますし、出力もできます。画像も入力できますし、出力のレベルも高いです。動画はまだ(音声)入力ではありませんが、出力のクオリティが高い。1年間で大きく変わったんじゃないかなと思っています。
マルチにいろいろなAIを使ってコンテンツを作っていらっしゃると思うのですが、違いは感じますか?
高桑:感じます。Midjourneyは僕も有料課金していまして。まさにV4くらいから入ったんですけど、あらためてV6を見て、「すごいな」と(思います)。
池田:ぜんぜん違いますよね。
高桑:ぜんぜん違います。V5あたりから、人間を生成した時に指がちゃんと5本になり始めて、けっこう話題になりました。
池田:昔は6本でしたからね(笑)。
高桑:そうなんです(笑)。いろいろなところから指が生えちゃっていて。今はそういう矛盾がほとんどなくなってきています。
マッチングアプリでも、人なのかAIなのかわからないアイコンがたくさん増えてきています。逆に目利きがないと困るくらい、リテラシーのキャッチアップに追われています。そういうリスクというか心配ごとの観点でも、(2023年は)いろいろあったと思いますね。
池田:ありますよね。今「フェイクニュースが作れますね」というコメントが来ましたが、本当に作れちゃうんですよね。
高桑:もうドンピシャですね。
池田:なんなら、すでにけっこう出ていますからね(笑)。海外だとMrBeast (ミスター・ビースト)という有名なYouTuberがいるんですが、その人が投資商品を勧めているという(笑)。
高桑:(笑)。
池田:最近Facebookでも、ホリエモンや有名な方が語っているやつがけっこう出てくるんですけど、あの動画版が出回っています。正直日本人が聞いても英語はそれなりに聞こえますし、動画のクオリティも高いので本当に本人に見えるんですよね。
高桑:(見抜くのは)難しいと思います。今のところは、毛穴がないとか背景の幾何学的な矛盾などが(見抜く)コツらしいんですよね。
池田:なるほど。見分け方のコツですね。
高桑:そうです。例えば今、お見せしている画面の後ろに青色のラインの壁があるのですが、向かって右側が数センチメートル上になってしまっています。背景の構造的な矛盾が、今のところAIは苦手らしいです。
池田:なるほど。
高桑:例えば人物だったら人に目が行きがちで、これから毛穴もどんどんリアルになっていくので、意外と背景の矛盾のほうが見つけやすいという話も出てきていますね。
池田:なるほど。これから自分がだまされないために覚えておきたいテクニックですね。(笑)。
高桑:(笑)。僕もそのマインドでキャッチアップしています。
池田:最近は音声を真似されて、オレオレ詐欺的なものに使われるリスクがあるくらいクオリティが上がっているので。マイナス部分を懸念しつつ、プラス部分としてできることをどんどん活かしていくと、楽しくなるんじゃないかと思います。
2024年は、ChatGPTがExcelやWordのような位置付けになる? 生成AIの専門家が予想する、ビジネスパーソンの「使えて当たり前」のスキルの変化
ChatGPTの精度は「50点」でも、資料をゼロから作るよりマシ 『ChatGPT最強の仕事術』著者が教える、生成AI実践のコツ
リアルと見紛うほどに精巧な生成AIの「矛盾」を見抜くには フェイク画像にだまされないために覚えておきたいテクニック
プロンプトエンジニアの必須スキルは「倫理的思想」 世界的な求人の増加と、求められる“良識の明文化”
人類の最後の仕事は、自分たちのタスクを自動化すること AIが進化した未来で「遊びが仕事」になるまで食いっぱぐれないための働き方
2024.11.13
週3日働いて年収2,000万稼ぐ元印刷屋のおじさん 好きなことだけして楽に稼ぐ3つのパターン
2024.11.11
自分の「本質的な才能」が見つかる一番簡単な質問 他者から「すごい」と思われても意外と気づかないのが才能
2024.11.13
“退職者が出た時の会社の対応”を従業員は見ている 離職防止策の前に見つめ直したい、部下との向き合い方
2024.11.12
自分の人生にプラスに働く「イライラ」は才能 自分の強みや才能につながる“良いイライラ”を見分けるポイント
2023.03.21
民間宇宙開発で高まる「飛行機とロケットの衝突」の危機...どうやって回避する?
2024.11.11
気づいたら借金、倒産して身ぐるみを剥がされる経営者 起業に「立派な動機」を求められる恐ろしさ
2024.11.11
「退職代行」を使われた管理職の本音と葛藤 メディアで話題、利用者が右肩上がり…企業が置かれている現状とは
2024.11.18
20名の会社でGoogleの採用を真似するのはもったいない 人手不足の時代における「脱能力主義」のヒント
2024.11.12
先週まで元気だったのに、突然辞める「びっくり退職」 退職代行サービスの影響も?上司と部下の“すれ違い”が起きる原因
2024.11.14
よってたかってハイリスクのビジネスモデルに仕立て上げるステークホルダー 「社会的理由」が求められる時代の起業戦略