2024.10.21
お互い疑心暗鬼になりがちな、経営企画と事業部の壁 組織に「分断」が生まれる要因と打開策
リンクをコピー
記事をブックマーク
南野:じゃあ、本題に移っていきたいと思いますけれども、現場とアプリケーションとLLMというところで、まずちょっとストックマークさんからお話しいただければと思います。
現場の要望であったりとか、アプリケーションをこう作っていこうという中で、「LLMを、じゃあ、こうする」で作っていけばいいんじゃないかとか。そういった部分の、LLMの作り方の要件であったりとか思考回路であったりとか、そういうところをぜひ教えていただければと思います。
近江:そうですね。やはりLLMでアプリケーションを作るのはけっこう難しいと思っています。例えば、ちょっとChatGPTとかを使った例で、我々のサービスの中でLLMを使ってRAGをやっているようなシステムがあるんですけども。
だいたい最初にチューニングして、プロダクト側とどういう出力をしたらいいかみたいなところで話し合って、「じゃあ、そこに向けてチューニングしましょう」というところで、リサーチ側でチューニングして出すんですけども。
けっこういくつかのバージョンを出して、プロダクト側の人に評価してもらったり自分たちで評価してもらったりするんですが。人によってどのモデルがいいのか意見が異なるみたいなところがあって、やはり出力として言葉が出てくるので、それに対する捉え方みたいなのがあって、人によってけっこう違うみたいなところがあって。
最終的に、なんとなくこうしたいというのはあるんですけど、「本当にどこらへんを目掛けていけばいいのかな?」みたいなところの意思統一を図るのは、けっこう難しい。そこは一番苦労するところかなと思います。
それで、お互い話し合っていきながら最終的なゴールを目指すわけですけど、今まではけっこう明確に、「このワードを抽出できればOK」みたいな要件とかがあったりしたんですが、最近はもう、出力が言葉になってきているので、そこらへんの要件をどう絞っていくかみたいなところの難しさは感じますね。
近江:あと、ちょっとLLMを使い出してから開発の仕方とかがけっこう変わっていったなと思っています。今までNLPのアプリ機能を作ろうとすると、やはりリサーチャーなりエンジニアなり、けっこう関わらなきゃいけなかったんですけども。
もうプロンプトをいじればけっこう調整できてしまうみたいな側面もあるので。プロダクト側のPdMがいろいろ調整しているだけでもけっこう簡単なアプリケーションができたりみたいなことも起こり始めてきたので、本当にアプリケーションを作るみたいな現場も、今までとはやり方がかなり変わってきているなとは感じますね。
南野:アプリケーションがうまく動かない時に、「LLMをちょっと変えて」みたいな、そんなようなやり取りはあったりするんですか?
近江:ですね。どちらかというと、「この出力いいですね」というより、「こういう出力をなくしてほしい」みたいな要件とかがあって、そういうものに対応するみたいなことは、けっこうありますね。
南野:その部分は、あんまりガチャは関係ないんですか?
近江:事前学習よりは少ないですけど、チューニングも多少ガチャな部分があるので。例えば、同じデータでも、ちょっと最初の初期値が変わるだけで出力が微妙に変わったりみたいなところもあるので、そこらへんも一定、ガチャの要素はあるかなとは思います。ただ、事前学習に比べるとだいぶ不確定性は低いかなと思います。
南野:ありがとうございます。
南野:じゃあ、ぜひ、ELYZAでどんなことをやられているかも、曽根岡さん、お願いします。
曽根岡:ありがとうございます。我々はですね、いろいろな大企業の方々からご相談を受けて、どういうふうに……LLM自体もそうですし、その周辺のシステムとして作るべきかみたいなところをご一緒することがあったりします。やっていく中で得られた知見は、ほとんど近江さんがおっしゃってくださったことに近いんですけれども。
やはり評価。評価が大事なんですね。みなさん、今日このままいくとガチャが頭に残るかもしれないんですけど……。
南野:(笑)。
曽根岡:ぜひとも、「評価が大事」と、これを覚えて帰っていただきたいなと思っています。
近江さんがおっしゃっていたとおり、今までのAIは、顔写真を入れて、男性か女性かを当てる。これはテストデータを100枚用意しておけば、AIを作った瞬間、「このAIは、98パーセントの精度です」とか出せたんですけれども。
生成AIは、生成するんですよね。じゃあ、生成されたテキストがいいか悪いかなんて、どうやって評価するのか。これは非常に難しくてですね。結果、結論だけ言いますと、最終的に使うエンドユーザーにちゃんと評価をさせる。これが本当に重要なことになっています。
LLMの活用でよく失敗しているなと思うのは、「コンタクトセンターのオペレーターさんが使うLLMの処理を作ろう」と。「がんばって、プロンプトエンジニアリングをAIエンジニアがやりました」とやっても、やはりオペレーターさんからすると、最後に出てきた処理はフィット感がない。
なので、我々が一番お勧めしているのは、どんなものもエンドユーザーにすぐ当てて、使ってみてもらって、駄目なところを指摘してもらう。こういうフィードバックループを速く回すような活用が非常に重要なんじゃないかなと思っています。
南野:ありがとうございます。
南野:ちょうど時間になってきたので、最後にみなさん一言ずつ、今後半年、1年でどんなことをやっていこうかであったりとか、そういった意気込み、大規模言語モデルに懸ける意気込みみたいなものを一言ずついただいて、終わっていきたいと思います。
では、近江さんからお願いします。
近江:そうですね。我々はけっこうこの半年ぐらい、LLMを作るということをメインでやってきたんですけど、今後は、しっかりそれを使ってお客さまの価値を出すみたいなところをやっていきたいなと思います。と言いつつ、たぶん新しいLLMをまた作っていくんだろうなと思いますので、また、なんらかの機会でお話しできたらいいのかなと思います。ありがとうございます。
南野:ありがとうございます。じゃあ、曽根岡さん、お願いします。
曽根岡:我々はですね、3月に本当にChatGPT、GPT-3.5 Turboぐらいの性能のモデルを作ることができた状態ではあるんですけれども。我々の認識としては、使う時に選ぶことができる、選ぶ選択肢に入れることができるLLMを今作れたなとは思っているんですが。このあたりはやはり選ばれるLLM、そして選ばれるLLMの先に、事業としての継続性がある事業を作っていかなければいけないということを常々社内で話しています。
なので、我々は、この後の1年間、半年間やっていくことはですね。まず、「今のLLMはOpenAIと遜色ないけれど、それだったらOpenAIを使うよね」という状況だとは思いますので、なにか、ちゃんとユニークネスがあって選ばれるLLMを作っていくということをします。
あと、この作ったLLMをですね、ただ持っているだけじゃなにも社会は変わらないというところで、APIサービスだったりとか、先ほどお伝えしたような大企業さんとのコラボレーションの中でしっかり使っていくことを徹底してやっていこうと考えています。
以上です。ありがとうございました。
南野:ありがとうございます。
南野:じゃあ、岡崎先生、お願いします。
岡崎:2024年の1年は、おそらくOpenAIのモデルとか大企業のモデルと肩を並べる性能の日本語の言語モデルが出てくる年なんじゃないかと思っています。
GENIACの支援で作っているものとか、大規模なモデルで性能のいいものが出てくるかもしれませんし、継続事前学習で作っているモデルですごく高い性能が出てくるかもしれなくて、それをまず、しっかり開発することが大事かなと。2024年はけっこう勝負の1年かなと思っています。
あと、研究者として何ができるかというと、やはりいろんな苦労はあるんですけれども、それを苦労と感じないような人たちなので、「こういうモデルを作るためには、こういうことに気をつけなきゃいけないから」という知見をしっかり溜めていって、どんどんそれを広く共有していくようなかたちで、みんなで盛り上げていければなと思っています。
南野:ありがとうございます。以上でこのセッションを終了していきたいと思いますけども。大規模言語モデルをそもそも作っている方々は日本でもかなり少なく、その中で、この産業としてすごく必要だなといったところで、全員で支えながらみなさんの進捗を見守っていきたいと思うので、みなさん、ご協力をお願いします。すごく知見のある話、ありがとうございました。
岡崎:ありがとうございました。
(会場拍手)
2024.11.13
週3日働いて年収2,000万稼ぐ元印刷屋のおじさん 好きなことだけして楽に稼ぐ3つのパターン
2024.11.21
40代〜50代の管理職が「部下を承認する」のに苦戦するわけ 職場での「傷つき」をこじらせた世代に必要なこと
2024.11.20
成果が目立つ「攻めのタイプ」ばかり採用しがちな職場 「優秀な人材」を求める人がスルーしているもの
2024.11.20
「元エースの管理職」が若手営業を育てる時に陥りがちな罠 順調なチーム・苦戦するチームの違いから見る、育成のポイント
2024.11.11
自分の「本質的な才能」が見つかる一番簡単な質問 他者から「すごい」と思われても意外と気づかないのが才能
2023.03.21
民間宇宙開発で高まる「飛行機とロケットの衝突」の危機...どうやって回避する?
2024.11.18
20名の会社でGoogleの採用を真似するのはもったいない 人手不足の時代における「脱能力主義」のヒント
2024.11.19
がんばっているのに伸び悩む営業・成果を出す営業の違い 『無敗営業』著者が教える、つい陥りがちな「思い込み」の罠
2024.11.13
“退職者が出た時の会社の対応”を従業員は見ている 離職防止策の前に見つめ直したい、部下との向き合い方
2024.11.15
好きなことで起業、赤字を膨らませても引くに引けない理由 倒産リスクが一気に高まる、起業でありがちな失敗
2024.11.13
週3日働いて年収2,000万稼ぐ元印刷屋のおじさん 好きなことだけして楽に稼ぐ3つのパターン
2024.11.21
40代〜50代の管理職が「部下を承認する」のに苦戦するわけ 職場での「傷つき」をこじらせた世代に必要なこと
2024.11.20
成果が目立つ「攻めのタイプ」ばかり採用しがちな職場 「優秀な人材」を求める人がスルーしているもの
2024.11.20
「元エースの管理職」が若手営業を育てる時に陥りがちな罠 順調なチーム・苦戦するチームの違いから見る、育成のポイント
2024.11.11
自分の「本質的な才能」が見つかる一番簡単な質問 他者から「すごい」と思われても意外と気づかないのが才能
2023.03.21
民間宇宙開発で高まる「飛行機とロケットの衝突」の危機...どうやって回避する?
2024.11.18
20名の会社でGoogleの採用を真似するのはもったいない 人手不足の時代における「脱能力主義」のヒント
2024.11.19
がんばっているのに伸び悩む営業・成果を出す営業の違い 『無敗営業』著者が教える、つい陥りがちな「思い込み」の罠
2024.11.13
“退職者が出た時の会社の対応”を従業員は見ている 離職防止策の前に見つめ直したい、部下との向き合い方
2024.11.15
好きなことで起業、赤字を膨らませても引くに引けない理由 倒産リスクが一気に高まる、起業でありがちな失敗