2024.12.19
システムの穴を運用でカバーしようとしてミス多発… バグが大量発生、決算が合わない状態から業務効率化を実現するまで
リンクをコピー
記事をブックマーク
株式会社FIXERが主催した本イベントでは、2023年の生成AIトピックスを振り返りながら2024年のトレンド予想や活用方法について語られました。本記事では、「ChatGPT最強の仕事術」著者の池田朋弘氏と、株式会社FIXERプロンプトエンジニアの高桑宗一郎氏が、音声や画像の生成AIの進化についてお話しします。
池田朋弘氏(以下、池田):(高桑さんは)全自動でPodcastを作っていて、文章やコンテンツもガンガン作っていると思うんですけど、これはどうですか?
高桑宗一郎氏(以下、高桑):まさに僕も当てはまっていますね。Podcastの台本が10分尺だとすると相当な文章量ですので、繰り返し使うところでは(生成AIを)使っています。
「成形」というワードがありましたが、文章以外で使うシチュエーションとしては、インプットの時に全体図を把握したい場合や、それぞれの要素の因果関係を体系化して理解したい場合ですね。読書のような、ものすごく自由に寄り道できるバージョンでもよく活用しています。
散歩していて「なんで高速道路の蛍光灯はオレンジなんだろう」と思った時や、そこから発展したことなど、体系的に聞きたい時は全部生成AIに聞いていますね。
池田:すばらしい。使いこなしていますね。では次に行こうと思います。文章以外の生成AIの話ですね。まず2023年は音声がヒットしたかなと思っています。
スマホのアプリが出たのが2023年の5月だったのですが、音声入力でパッと聞けるのはすごく楽なんですね。ちなみに先ほどの高速道路の(蛍光灯の)話は音声ですか、それとも自分で入力するんですか?
高桑:音声ですね。
池田:そうですよね。音声のほうが楽かなと思います。外にいる時や移動中、あとは考えが整理されていなくて文章にするのが面倒くさい時や、疲れていてパソコンで入力したりスマホでフリックしたくない時に音声はすごく楽だなと。
あとは画像です。2023年の1月(時点)ではMidjourney(ミッドジャーニー)という画像生成AIはV4でしたが、今はV6になっています。これは同じプロンプトなんですが、リアリティが格段に違いますし、クオリティもまったく違います。
また「Flat Illustrationで世界地図っぽいのを描いてくれ」と言った場合、V4もけっこうクオリティが高かったんですが、V6はリアリティも洗練されているレベルも違うなと。画像もすごく良くなったなと思います。
池田:これは映像ですけど、上が新しい動画生成AIで下が昔のバージョンです。昔のもすごいんですけど、やっぱり新しいバージョンになってくるとリアリティのレベルが違います。下は「生成AIだな」という感じですけど、上は「あれ? 本物?」となっています。このあたりの精度のレベルは、1年間だけでもガーっとクオリティが上がったなと、さまざまなところで思います。
これは「HeyGen(ヘイジェン)」という人間のアバターを自分の映像から作るものです。(スライドは)私のAI映像なんですけど……1分くらいの動画を撮って1回学習させると、このテイストの動画が無限に作れるサービスです。
さまざまな領域で音声入力ができますし、出力もできます。画像も入力できますし、出力のレベルも高いです。動画はまだ(音声)入力ではありませんが、出力のクオリティが高い。1年間で大きく変わったんじゃないかなと思っています。
マルチにいろいろなAIを使ってコンテンツを作っていらっしゃると思うのですが、違いは感じますか?
高桑:感じます。Midjourneyは僕も有料課金していまして。まさにV4くらいから入ったんですけど、あらためてV6を見て、「すごいな」と(思います)。
池田:ぜんぜん違いますよね。
高桑:ぜんぜん違います。V5あたりから、人間を生成した時に指がちゃんと5本になり始めて、けっこう話題になりました。
池田:昔は6本でしたからね(笑)。
高桑:そうなんです(笑)。いろいろなところから指が生えちゃっていて。今はそういう矛盾がほとんどなくなってきています。
マッチングアプリでも、人なのかAIなのかわからないアイコンがたくさん増えてきています。逆に目利きがないと困るくらい、リテラシーのキャッチアップに追われています。そういうリスクというか心配ごとの観点でも、(2023年は)いろいろあったと思いますね。
池田:ありますよね。今「フェイクニュースが作れますね」というコメントが来ましたが、本当に作れちゃうんですよね。
高桑:もうドンピシャですね。
池田:なんなら、すでにけっこう出ていますからね(笑)。海外だとMrBeast (ミスター・ビースト)という有名なYouTuberがいるんですが、その人が投資商品を勧めているという(笑)。
高桑:(笑)。
池田:最近Facebookでも、ホリエモンや有名な方が語っているやつがけっこう出てくるんですけど、あの動画版が出回っています。正直日本人が聞いても英語はそれなりに聞こえますし、動画のクオリティも高いので本当に本人に見えるんですよね。
高桑:(見抜くのは)難しいと思います。今のところは、毛穴がないとか背景の幾何学的な矛盾などが(見抜く)コツらしいんですよね。
池田:なるほど。見分け方のコツですね。
高桑:そうです。例えば今、お見せしている画面の後ろに青色のラインの壁があるのですが、向かって右側が数センチメートル上になってしまっています。背景の構造的な矛盾が、今のところAIは苦手らしいです。
池田:なるほど。
高桑:例えば人物だったら人に目が行きがちで、これから毛穴もどんどんリアルになっていくので、意外と背景の矛盾のほうが見つけやすいという話も出てきていますね。
池田:なるほど。これから自分がだまされないために覚えておきたいテクニックですね。(笑)。
高桑:(笑)。僕もそのマインドでキャッチアップしています。
池田:最近は音声を真似されて、オレオレ詐欺的なものに使われるリスクがあるくらいクオリティが上がっているので。マイナス部分を懸念しつつ、プラス部分としてできることをどんどん活かしていくと、楽しくなるんじゃないかと思います。
2024年は、ChatGPTがExcelやWordのような位置付けになる? 生成AIの専門家が予想する、ビジネスパーソンの「使えて当たり前」のスキルの変化
ChatGPTの精度は「50点」でも、資料をゼロから作るよりマシ 『ChatGPT最強の仕事術』著者が教える、生成AI実践のコツ
リアルと見紛うほどに精巧な生成AIの「矛盾」を見抜くには フェイク画像にだまされないために覚えておきたいテクニック
プロンプトエンジニアの必須スキルは「倫理的思想」 世界的な求人の増加と、求められる“良識の明文化”
人類の最後の仕事は、自分たちのタスクを自動化すること AIが進化した未来で「遊びが仕事」になるまで食いっぱぐれないための働き方
2024.12.12
会議で発言しやすくなる「心理的安全性」を高めるには ファシリテーションがうまい人の3つの条件
2024.12.19
12万通りの「資格の組み合わせ」の中で厳選された60の項目 532の資格を持つ林雄次氏の新刊『資格のかけ算』の見所
2024.12.16
32歳で成績最下位から1年でトップ営業になれた理由 売るテクニックよりも大事な「あり方」
2023.03.21
民間宇宙開発で高まる「飛行機とロケットの衝突」の危機...どうやって回避する?
2024.12.10
メールのラリー回数でわかる「評価されない人」の特徴 職場での評価を下げる行動5選
2024.12.13
ファシリテーターは「しゃべらないほうがいい」理由 入山章栄氏が語る、心理的安全性の高い場を作るポイント
PR | 2024.12.20
モンスター化したExcelが、ある日突然崩壊 昭和のガス工事会社を生まれ変わらせた、起死回生のノーコード活用術
2024.12.18
「社長以外みんな儲かる給与設計」にした理由 経営者たちが語る、優秀な人材集め・会社を発展させるためのヒント
2024.12.12
今までとこれからで、エンジニアに求められる「スキル」の違い AI時代のエンジニアの未来と生存戦略のカギとは
PR | 2024.11.26
なぜ電話営業はなくならない?その要因は「属人化」 通話内容をデータ化するZoomのクラウドサービス活用術
Climbers Startup JAPAN EXPO 2024 - 秋 -
2024.11.20 - 2024.11.21
『主体的なキャリア形成』を考える~資格のかけ算について〜
2024.12.07 - 2024.12.07
Startup CTO of the year 2024
2024.11.19 - 2024.11.19
社員の力を引き出す経営戦略〜ひとり一人が自ら成長する組織づくり〜
2024.11.20 - 2024.11.20
「確率思考」で未来を見通す 事業を成功に導く意思決定 ~エビデンス・ベースド・マーケティング思考の調査分析で事業に有効な予測手法とは~
2024.11.05 - 2024.11.05