2024.12.19
システムの穴を運用でカバーしようとしてミス多発… バグが大量発生、決算が合わない状態から業務効率化を実現するまで
Vector Storeを使って社内向けのChatGPTを少し頭良くした件(全1記事)
リンクをコピー
記事をブックマーク
白田幹氏:「Vector Storeを使って社内向けのChatGPTの頭を少しだけ良くした話」というところで、ちょっとお話できればと思っています。
はじめに、自己紹介をさせてください。株式会社リンクアンドモチベーションという会社におります、白田幹と申します。2020年新卒入社で、データサイエンティストとしてこれまで働いてきたのですが、「ChatGPT」の登場とともに今はLLM推進担当というところで、基本的には社内に向けてLLM開発推進の仕事をしています。
趣味は、筋トレとアメフトです。よろしくお願いします。
弊社、リンクアンドモチベーションは、人材、HR領域で、SaaSのプロダクトをいくつか提供しています。
「モチベーションクラウド」と、「ストレッチクラウド」というサービスですね。組織のエンゲージメントを測るクラウドと、個人の成長を支援するクラウドの2つを主に提供しています。その2つのどちらも、ChatGPTのAPIを使って機能開発を行いました。
これ以外には、以前別のイベントで別の者が登壇した内容にはなりますが、「Chatbot UI」という、ご存じの方もいるかもしれませんが、ChatGPTをわりとセーフティに使える方法を使って、PDFやCSVなど、手元にあるドキュメントを渡して、エンベディングして、そこに対して受け答えができるよ、というプロダクトも社内向けではありますが作ったりしています。
というところで、(スライドを示して)今日はこのような流れでお話できればなと思っています。今日は、先ほどお話ししたChatbot UIに「Pinecone」をつないでちょっと頭を良くしてみたというお話ができればなと思っています。
ChatGPTになにかを聞きたい時に、その「なにか」をいきなり聞くのではなく、「それを考える上で、大事なことは何?」と先に聞いて、それを参照した上で質問に答えさせるということを、おそらく何人かの方はされたことがあるかなと思います。
ただ、「ホニャララで重要なこと教えて」と言った後に、「じゃあ、ホニャララやって」と言うのは面倒だなと思います。また、出力に対して、何度も同じフィードバックをして、「そうじゃなくて、こういうふうに考えて」みたいに言うのが、けっこう面倒というところに課題感があると思います。
「どこかで一度言ったことは覚えておいてくれよ」と思い、Vector Storeに質問とLLMからの出力自体を保存して、それを参照しようと考えました。
基本的にノーマルなChatGPTに質問する時は、Chat Historyと新しいクエスチョンを基にして最終的なアンサーを出していると思いますが、その仕組みだと、自分で重要な情報を先に聞いて毎回ここに溜めて、その後に質問しないといけません。
もしかしたら試したことがある方がいるかもしれませんが、LLMの出力をPineconeやVector Storeに格納して、次回以降似た質問が出た時は、そこを参照して回答するように変えました。そういう実装を行いました。
Vector Storeに、独自の「ChatPDF」みたいなPDFを入れたり、CSVを入れたりするというのはよくある話だと思いますが、LLM自身の出力を溜めてみるということをやってみました。
こうすることで、Chat Historyに加えて、別スレッドの会話内容だったり、以前したフィードバックだったりを基に回答してくれるようになります。
実装は、ちょっとお見苦しいところもあるのですが、個人的なこだわりポイントとしては、入れたVector Storeを検索した時に、similarityScoreが0.85以上だったらそれを引っ張ってくるということをやっています。
ということで、まとめに入る前にデモにいければと思いますが、今、初めてのスレッドに、「私の趣味は何でしょうか?」という質問を入れています。
ChatGPTに聞くと当然「わかりません」となると思いますが、動くかな……あっ、動きましたね。別のところで会話した内容として、Pineconeに溜めている内容を引っ張ってきてくれています。というところで、きちんと動いてそうですというところが見られたかなと思います。
まとめです。当然の話かもしれませんが、独自のデータ資産を増やそう、活用しようというところで、ChatGPTの学習にない独自のデータ、社内のドキュメントなどをエンベディングさせて使うのは、大事かなと思っています。
それに加えて、今回のようなChatGPTにもらった出力自体をエンベディングして溜めていくことも同時に大事になるかなと思っています。
これを溜めるためには、けっこういろいろなサービスがありますし、今日この後もPineconeについてのお話しする方もいるのかなと思いますが、このあたりのVector StoreのサービスやLLMを上手に活用していく必要があるなと思っています。
今後の展望としては、今はローカルに立てているので、組織内のいろいろな人が使えるようにしたいなと思っています。
あとは、すべての会話をすべてPineconeに入れるという処理にしてしまっているので、メタデータを利用したり、ユーザーが「good」というボタンを押したものだけをPineconeに保存して、良質なフィードバックだけをPineconeに溜めていくことができればいいなと思っています。
これができるようになって、組織内の人、いろいろな人が使えるようになると、ほかの人が入れた良いフィードバックを基に回答できるようになるので、集合知がVector Storeに溜まって、少なくとも無駄なやり取りがどんどん減っていくかなと思っています。
ほかにもいろいろサービスがあるので、みなさんでここらへん盛り上げていけたらなと思っています。以上です。ありがとうございました。
(会場拍手)
2024.12.20
日本の約10倍がん患者が殺到し、病院はキャパオーバー ジャパンハートが描く医療の未来と、カンボジアに新病院を作る理由
2024.12.19
12万通りの「資格の組み合わせ」の中で厳選された60の項目 532の資格を持つ林雄次氏の新刊『資格のかけ算』の見所
2024.12.16
32歳で成績最下位から1年でトップ営業になれた理由 売るテクニックよりも大事な「あり方」
2023.03.21
民間宇宙開発で高まる「飛行機とロケットの衝突」の危機...どうやって回避する?
PR | 2024.12.20
モンスター化したExcelが、ある日突然崩壊 昭和のガス工事会社を生まれ変わらせた、起死回生のノーコード活用術
2024.12.12
会議で発言しやすくなる「心理的安全性」を高めるには ファシリテーションがうまい人の3つの条件
2024.12.18
「社長以外みんな儲かる給与設計」にした理由 経営者たちが語る、優秀な人材集め・会社を発展させるためのヒント
2024.12.17
面接で「後輩を指導できなさそう」と思われる人の伝え方 歳を重ねるほど重視される経験の「ノウハウ化」
2024.12.13
ファシリテーターは「しゃべらないほうがいい」理由 入山章栄氏が語る、心理的安全性の高い場を作るポイント
2024.12.10
メールのラリー回数でわかる「評価されない人」の特徴 職場での評価を下げる行動5選
Climbers Startup JAPAN EXPO 2024 - 秋 -
2024.11.20 - 2024.11.21
『主体的なキャリア形成』を考える~資格のかけ算について〜
2024.12.07 - 2024.12.07
Startup CTO of the year 2024
2024.11.19 - 2024.11.19
社員の力を引き出す経営戦略〜ひとり一人が自ら成長する組織づくり〜
2024.11.20 - 2024.11.20
「確率思考」で未来を見通す 事業を成功に導く意思決定 ~エビデンス・ベースド・マーケティング思考の調査分析で事業に有効な予測手法とは~
2024.11.05 - 2024.11.05