“膨大すぎる情報”をどう扱っていくか?

川崎佑治氏(以下、川崎):リバネスでも「情報量が多すぎる」という文句は出るんですか? 世界中の論文などドキュメントをたくさん読み漁ってる人たちでしょうに。情報量が多すぎるというのは、わりとうちの会社や他の会社でも聞かれる声なんですけど。

吉田丈治氏(以下、吉田):やっぱり出ますね。ただでさえ情報量が多いので、読まなきゃいけない情報が多いんですよね。難易度が高いものからそうじゃないものまで、いろいろあるじゃないですか。どういうふうにメモリを使うかという感じですけれども。

人間の脳みそのリソースをどういうふうに割り振るのかというところで、情報量が多すぎると、やっぱり漏れが発生してしまう。そこはけっこううれしい悲鳴としてはあるのかなと。蓄積量は変わるので、それは読めないよなって。

川崎:プロ集団でこうならば、一般の我々はもっとこう(情報過多)ですね。

吉田:そうなるんじゃないですか。本来はそうなるべきなんですけれども、こういった(情報を蓄積できる)方向に変わっていけるようにしていかないといけないですね。そこまで至っていない組織もまだあるという。

川崎:確かに贅沢な悩みではありますよね。情報がなくてどうしたらいいんだというよりは、ずいぶん悩みのレベルとしては高いと。

吉田:そうですね。「情報量が多すぎるって、どういうことなんだっけ」という話なんですけど。社内の組織として、登録された情報をもう全部読むことはできないという前提にしました。全部が頭に入っている人はいないということです。

すべての情報を網羅するより、検索できるインフラを作る

吉田:これは時代の要請と一緒で、例えば、最近よく「上司が正解を知ってると思うな」みたいな話があるじゃないですか。

今までは上司が(正解を)知っていて、そこに向けて部下がいろんな提案をしていくことで回ってきたのが、だんだん答えがないことが増えてくる。上司が全部決められるかと言ったら、そんなことはないよねと。

リバネス自体は科学者集団で、最先端のよくわからないことが舞い込むことが多いので、基本的にはみんな答えを持ってないことが多いんですね。

我々としては、しょうがないので、答えを持っているのが上の人と思わないようにカルチャーを作ってきました。やっぱり全部の情報が頭の中に入っている状況なんてあり得ないので。

そうではなくて、いろんな人がいろんなサポート範囲を持っていることで、全体のパワーになるような設計をしてきています。まぁ漏れてるんだけど、それはそれでいいでしょと。当たり前でしょという感じで腹落ちはさせています。ただ、蓄積はちゃんとやろうねと言っています。なぜかは後ほどお話しするんですが。

川崎:漏れるのが当たり前ってことですよね。

吉田:当たり前です。後で検索できればいいわけで、漏れてもいいんですよ。その情報にたどり着ければいい話なので、そのためのインフラを作っていく。

川崎:なるほど。インターネット的な感覚とちょっと似てますよね。すべてを監視しているわけではないんだけれども、必要な時にたどり着けばいいんだと。

必要な情報に短時間でたどり着くには

吉田:本当にそうですよね。集合知にしていくようなところに、けっこう似てるんじゃないかなと思ってますね。あとは、情報としては一番下の(レベルの悩みである)、情報の密度の低さやテキスト量が多すぎるというもの。

人間が文章を書いていると、やっぱり情報密度を適切にして文章を書ける人と、無駄なことをごちゃごちゃ書いて量だけ多い人とか。経験値によってけっこう発生してしまうんですよね。

それをそのまま人間が読むことが本当に現実的なのかというと、やっぱり難しいんじゃないかなと。我々は今(創業)22年目ですけれども、そういう結論が1つありますね。情報の摂取に時間がかかりすぎる状態をクリアしなきゃいけないというのは、別の問題として発生している感じです。

川崎:なるほど。

吉田:「必要な情報に短時間でたどり着きたい」とみんな思っているんだけれども、それをどう実現していくんですかというところに次のチャレンジがあります。

川崎:でも、情報のインプット側は、もう個人差だからどうしようもないですよね。

吉田:そうですね。やっぱりそこはもう今まで日本語をどう取り扱ってきたのかとか、プレゼンテーション能力や文章力も一緒ですけれども、経験に寄りすぎてしまうので。究極的には、小学校の国語の勉強からやり直せみたいな話につながってしまうと。

そこはもうしょうがないので、それはそれで置いておいて、技術で別途解決していくことを考えなきゃいけないということです。

新人の議事録係を廃止

川崎:個人差はあるものとして、技術でそこを埋めにかかる発想ですね。

吉田:今まではちょっと難しかったんですけど、生成AI時代になって「これはけっこうできるようになったんじゃないの?」と個人的には思っています。そこに対応するために、抜本的に改革を実施したのが2024年3月ですね。

それで、蓄積する情報のクオリティを上げていく必要性がありますと。「Gavage inしていませんか?」と書いていますが、最初のところに戻るんです。

例えば会議の議事録ですね。よくミーティングに行くとみんな議事録を取ってると思うんですけれども、人材育成も兼ねてけっこう新人が書きますよね。登場人物が誰で、この会社とはこういう関係性だからということを踏まえて書くみたいな。

川崎:ちょっとツボを外してるけど、正直、このあと議事録が何で有用に使われることはなくて「ただの記録なんでまあいっか」みたいな(笑)。

吉田:けっこうそうなりがちです(笑)。議事録って、「本当に必要?」みたいなものも多かったりするんですけど、もう新人が記録することも廃止しました。これはなぜかというと、議事録のクオリティ自体はやはり記録者に依存してしまいます。

それで本当に良質な議事録、蓄積すべき情報をちゃんと蓄積できてるかとみなさんに質問したら、「完璧です」「イエス」って言える人はたぶん……。「皆無」と書きましたけど、ほぼ皆無に近いんじゃないかなと思っていまして。議事録の生成自体は、もう生成AIのタスクとして設定してしまって……。

議事録として本当に残すべき情報は2つ

川崎:「生成AI vs 新人」といったら、どっちが良いんですか。

吉田:僕個人的には、生成AIのほうが絶対良いと思います(笑)。長めに見てもクオリティは絶対安定しますし、100点は取れないと思いますけれども、70点ぐらいはいけるんじゃないかなと。

川崎:新人とベテランの間は狙えると。

吉田:狙えますね。

川崎:だったらAIのほうが良いですね(笑)。

吉田:そう、良いんじゃないかなと思うじゃないですか。でも、ここから先がけっこう大事な話です。活動としては、録音を文字起こしして議事録にまとめるという流れなんですけど。「本当に必要な蓄積はこれです」というふうに、リバネスの中で定義を再設定しました。

音声から起こす議事録は、「事実としてみんなが会話してどういう流れになりましたか」というのを書き起こして、生成AIが読み込んで再構成していくと、70点ぐらいは取れます。

ただ本当に欲しい情報、「これから事業として再利用したい情報って何だっけ?」というと、参加した各々の人がどんなことを考えたかのほうが重要です。事実はこうでしたと。一方で、参加していた社長はこう思いました、部長はこう思いました、新人はこういうふうに思いました、という思惑の部分。

今まで議事録にはそれはあんまり乗ってこなかったと思うんですが、情報の蓄積としてはけっこう大事なので、それを乗せていくと。

川崎:両方乗っけるとしたら、「事実」という欄と、「思惑」という欄を作ったってことですか?

吉田:まさにそうです。それを残しておくことによって、どのタイミングでこういう会話がなされて、どう思われていたのかがわかります。それこそが、会議の時間の中での情報量じゃないですか。すべての情報がちゃんと蓄積されるわけですね。

会議での思惑は人間が書き、事実は生成AIが記録

川崎:思惑は誰が書くんですか?

吉田:思惑は会議参加者が(自分で書きます)。これもSlackで通知がくるんですけれども、参加した人に「ボタンを押してここから書いてね」という感じで通知がきて、みんなで書きます。

みんなで書いて、事実の録音はファイルのアップロードボタンがあるのでパッと押して、それが文字起こしされましたと。その下に入力ボタンがあって、各々が全員書きましたとなった段階で、答え合わせみたいなことができるようになる感じですね。

川崎:文字起こしとその要約は生成AIでやって、そのあとに「思惑は各自Slackで入れてね」という通知が来るので入れていったら、もうそれで録音も含めて、事実と思惑の両方のデータがSalesforce上に残るということですね。

吉田:そうです、そうです。

川崎:わりときれいな残し方かもしれないですね。

吉田:そうなるんじゃないかなと思いますね。この良い点が、けっこう社員教育にもつながりやすいんですよね。例えば今まではラップアップして、「あの時こうだったね」という話を先輩から聞かないと答え合わせができなかったのが、みんなが各々帰り道でバババッと入力しておけば入ってきます。

後輩が「先輩はこんなことを考えてたのか」とすぐわかるようになるので、わざわざ教育する時間を持たなくても、ある一定の育成みたいなところに寄与できると思っています。

蓄積された大量の情報は、人の代わりにAIが処理

吉田:もう1個大事なのは、そういうふうに整形しておいた情報って「本当にそれを人間が読むんだっけ?」となるんですよ。「その議事録を読む人は人間ですか?」というところで、これこそが「Gavage in」にならないために重要です。

最終的に利用するのは人間じゃなくて、それこそ生成AIかもしれない。生成AIに渡せば、ある程度の文章量がある議事録でも、再活用がしやすいんですよね。そのために記録を残しておくという感じになっています。

思惑はその人の個人の入力なので、別に自由に書いてもらえばいいじゃないですか。そこに正解も不正解もないわけです。それはそれで残しておいて、全体を読むのは生成AIですよという状況を作り始めたのが今年ですね。

そんな感じで、事実の記録と思惑の記録を分離して、かつ両方残していくことにしました。「議事録作成って時間がかかるわりに価値にならないじゃん」と思っている人がけっこういるんじゃないかなと思うんですが。そこを解消してもっと別のことで人材育成しましょう、と社内を変えています。

あとは先ほど言ったとおり、大量の議事録がダーッと登録されていくわけですね。それを最初に読む人は誰なのかっていうと……。このプロンプトビルダーは、生成AIが使えるSalesforceの製品の1つです。それが(データを)読み込みます、となっていきます。

なので「蓄積された情報を人間が全部読むの?」となったら悲鳴になるんですけれども、もう時代が変わりましたと。蓄積された情報を最初に読むのは生成AIです、機械が読みます。

川崎:確かに、人間はもうどんどん質問する側に回っていってますよね。

吉田:そうなると思いますね。

AIにとっては、情報は多ければ多いほどいい

川崎:途中でジョインした人にもいいですよね。「ここまでの話がどうなってるか教えて」「誰々さんはどういう方向で考えてるか教えて」と言うと、生成AIが読み込んで答えてくれるような。そういうふうに、情報摂取のムラをなくせそうですよね。

吉田:そうですね。そこはいかようにでも、いろんな切り方で分析ができるようになっていますし。しかも速いじゃないですか。これを本当に人間がやろうとすると、いろんな人を集めてきて「ミーティングです」ってやって(笑)。

川崎:時間をとってくるところから。

吉田:そうそう。全員の時間を同期的に処理しなきゃいけない。すごくコストが高いので、そうではない状態を作っていく。そういうふうに変わったんだよという話をして初めて、「活用できるぞ」という、うれしい悲鳴が聞こえてきます。

川崎:(情報は)多けりゃ多いほうがいいんだとなって、価値観が変わりますよね。「多いと読めないよ」というのは、人間が全部読まないといけないから思ってるんだけど。AIが読んで必要な時に答えてくれるとなれば「多いほうがいいじゃん」ということになるわけですね。これはけっこう大きなパラダイムシフトですね。

吉田:逆に言うと、これをやってしまうと、蓄積しなかった人のデータは引っかからないので、圧倒的に不利になるわけですよ。自分がやってきたことが再活用されないので、レバレッジが効かないじゃないですか。その時に使った時間ぶんしかバリューを出せないと効率悪い。

川崎:毎回時間や活動をドブに捨てるような感じになっちゃいますよね。

吉田:本当にもう右から左に流れていっちゃう感じです。例えばベテランになった時に何も情報が残ってないとなったら、本当にバリューが上がらないと思います。

これからは、そういう(情報の)蓄積をして再利用されるような人のほうが重宝されますし、ほかの人が自分を利用しやすくなるインフラを作るところがけっこう大事です。そういう世界が確実にくると思っています。

「情報を入れてもムダ」にならない時代になっていく

川崎:自分という概念も拡張してますよね。つまり「あの人に聞けばいいじゃん」の「あの人」というのが、もしかしたら「あの人」を直接電話か何かで対面で捕まえるっていうことだけじゃなくて。

「あの人」が残してくれてる大量のドキュメントなりデータなりに聞くと、答えが返ってくるのは、拡張されたもう1人のその人という感じがしますよね。

吉田:本当にそのとおりです。おそらく蓄積された情報から、それこそChatGPT的に、その人が直接答えてくれるところまでいくんでしょうけれども。そんなふうに拡張されていくというのが、イメージとしてはわかりやすい気がします。

というかたちで「怖くないよね」となったので、これまでできなかった情報のハンドリング方法がシェアされました。それによって安心して蓄積ができる。「これを入れたってムダになるだろう」という感じにならなくなってきた。

吉田:プラス、生成AIに関する教育の実行をやっています。生成AIに関する教育は、板書で「こうですよ」というふうにやるのがいいのかっていうと、そんなことはなくて。直接Slackの中で「Party on Slack」というアプリを作って、みんなが体験できるようにしています。

リリースしてから1年以上経ってまして、今ユーザーは7,000人ぐらいになってるんですけれども、社内だけじゃなくていろんな会社で使っていただいてます。

集団での学習が加速していくことのメリット

川崎:当社もお世話になっております。

吉田:そうですね。ベルシステムさんでもゴリゴリに使っていただいています。日本国内の生成AI活用に一石を投じて、どんどん布教されるようなアプリになっているという感じですね。

川崎:やはり1人がこっそり……こっそりじゃないんですけど(笑)。1つのWebブラウザの画面を開いて、その中で1対1でやっていくと、何を聞いてどう使うのかは、その人の体験だけで終わっちゃう。

ところが、ある程度見えているSlack上のチャンネルなんかでやってると、ほかの人が「こうやって使うんだ」となる。そうすると、ますます「自分もこういう使い方ができるな」というふうに、集団での学習が加速していく感じですよね。

吉田:まさにそうですね。だから、これを使っていくとスケールメリットがとてもあると言いますか。ネットワーク効果みたいなものが非常に適用されます。そもそも生成AIって、概念としても社会に出てきたのがこの1年とかで、まさに黎明期です。かつ、まだ正解までたどり着いていないようなツールなので。

そこを先進的に活用するアーリーアダプターみたいな人たちを、どんどん巻き込んでいって「こんなふうに使えるの?」と。「生成AIを使ったら、今まで1時間かかってたのが5分で終わるじゃん」ということがリアルに起こるツールだと思うんです。

そういった時間の圧縮効果をみんなで体験したり共有して、どんどん業務効率を上げていくために、これを使ってOJTをしてきました。

川崎:当社でももうすでに業務利用というか、普通に裏側の人がやらなくていい部分を生成AIに置き換えたりしています。やはりそういうことから、どんどんアイデアが跳ねていくところがありますよね。

Slack上で15億トークンもの処理が発生

川崎:このParty on Slackを通じてのトークン量は、どれぐらいになってるんですか? 

吉田:今、総合15億トークンですね。この1年でそれぐらい使ってます。

川崎:15億、えぇー……凄まじいですね。

吉田:相当凄まじい量の処理が、Slack上でなされているんじゃないかなと思います。みんなで活用していただいてます、というところですね。

最後に、さっきの情報の蓄積・開示みたいな話の続きで「分析と統合をしましょう」と言っていたんですが、ここって意外と難しいんですよね。

いろんな情報を統合していって、今あるものを昇華させていこうと考えるんですけれども。データ量が多すぎると、いろんなものを踏まえて最適解を出すのはけっこう難しいですし。

例えば、上司が「こういうふうにいくんだ」と言ったら、明確に逆らえる人はまあいないですよね。「データからこうしたほうがいいです」と言える人は、たぶんいないんですけれども。

それって、感覚で事業をドライブしてるような感じになるんですが、きっと今までの蓄積から最適な道を導き出せるようになっていくと。それこそが私たちが一番最初に思っていた分析・統合につながっていると思っています。

LLMを最大限に活用してなにかしらのインサイトを得て、人間がそこにアイデアを加えて昇華させていける時代が来ていると思って、そんなことをやろうとしています。

データはいろんなところにいっぱいあって、Data Cloudの中に入れましたという話をしたんですけれども。そういったものを使って「データ活用組織になっていくぞ」ということを考えてやっています。

現時点の生成AIでは情報の要約機能が役立つ

吉田:加えて、これはSFUG CUP(セールスフォースユーザグループカップ)の中では言わなかった話なんですけれども。今後、生成AIが当たり前になる世界がやってくると思っていますし、おそらくみなさんが「これ生成AIだ」と思わずに使ってるものもけっこうあるんじゃないかなと。

それがだんだん増えていくんじゃないかなと思っているんですけれども、例えばSlack生成AIが入ってくることを事例としてお話します。

「Slack AI」という製品がリリースされています。これは生成AIをフル活用した製品ですね。こういったものがいろんなプロダクトの中で、それこそMS系だとCopilotだとか、Googleなんかもそういったものを提供し始めていますけれども。

それらの製品の中で「フル活用って何なの?」という話なんですが。現時点の生成AIの機能の限界を踏まえると、一番活用されているのは、情報の要約機能。これは元ネタを要約するという圧縮の話なので、けっこうやりやすいんですけれども。

川崎:実際「情報が多すぎる」というペインを抱えてる方も多いから、喜ばれますよね。

吉田:そうですね。まさに、ものすごく忙しい上司が散々議論されたスレッドに導かれて「川崎さん、どうですか?」と最後に言われるわけですよ(笑)。

川崎:「これを最初っから読まなきゃいけないのか?」みたいな(笑)。

吉田:「待ってくれ」と(笑)。それをAIで圧縮して「重要な要点はこれで、あなたが決めないといけないポイントはここですよ」という話になるのが、ものすごく重要です。簡単にできるし、わかりやすくバリューを届けられる機能はけっこう実現されてます。

重要性が増していくのは、社内の情報の検索機能

吉田:もう一方で重要になってくるのが、検索という機能ですね。これが実は今後ものすごく重要な機能として、私は期待していますし、おそらく世界の人たちも期待していると思うんですが。

これは何なのかというと、例えば、Slackの中で提供された情報を基に「ベルシステムさんってどういう会社なの?」と、我々リバネスのSlackで検索する。

そうすると「ベルさんはこういう会社で、代表者がこういう方で、最近よくやり取りしているのは何々部門の誰々さんです」という話をまとめて出してくれるようになってくるわけですよ。

これはプラットフォームの中のデータを正確に反映して検索を出していこうよということで、Slackもやっていますし、ほかのデータのプラットフォームはみんな狙っている領域です。そういったものがどんどん投入されていくと考えています。

一方、そうなってくると良質なデータをプラットフォームに放り込んでいかなきゃいけないというふうになりますね。先ほど、議事録を新人がずっと書いていて、「なんかちょっと間違ってるけど、育成になるからいいじゃん」と川崎さんも言ってらっしゃったんですけど。

それを蓄積した結果、何が起こるかというと、ちょっと間違ったデータで学習したSlack AIがアウトプットを返してくるわけですよ。これは二重の意味で怖いことで、間違いが間違いを呼ぶわけですね。

その時、直属の上司は「まあこれぐらいでいっか」と思ってオーソライズしてしまった議事録を、何年かあとに誰かが検索した時に、それを基にアウトプットを得るわけです。

まさに「Gavage in」が「Gavage out」しちゃってるわけです。数ヶ月後でもいいんですけれども、「あれって本当に合ってます?」って確かめにいけますか?

川崎:確かに、それはムリですよね。

吉田:ムリだと思います。聞かれたほうも覚えてないし。そういうふうになっていくと、ある程度しっかり間違いがない状態で情報を蓄積しておく必要があります。客観的な情報が必要だし、恣意的な思惑の部分も別途必要だし。

情報の蓄積は「なるべく自動化しなさい」

吉田:ということで「なるべく自動化しなさい」と僕は思っています。人間が間に入ると、精度がどんどん下がっていくのが情報だと思っているので。

川崎:そうですね。人間が全部やってると、それこそデータ的には巨大なゴミ屋敷が誕生してしまって、足の踏み入れる場所がなく「どうやって生活してるんですか?」という状態にならざるを得ないと。

吉田:そうです。ものすごく巨大な伝言ゲーム装置みたいなものが出来上がってしまうよと。今の時点では「それを避けないといけないよね」という話を、きっと大真面目な顔して議論しなきゃいけないので。今はそんな時代に来ちゃってるんじゃないかということですね。

「自動化って何だっけ?」という話なんですけど、先ほどの議事録生成のほかにも、我々はいくつか自動化を考えています。最後にその紹介をちょっと差し上げたいんですけれども。

例えば情報の取得に関しては、私で言うと生成AIの話を取得しておきたいということで、RSSという情報の配信の仕組みをこの「Party on Slack」というアプリに登録しておきます。

そうすると、新しい記事が出ると自動的に取得されて、「こういうふうにまとめて」という指令を生成AIに出せますので、欲しい情報を特定の形式でアウトプットさせて置いておくことができます。

最終的に「これってどうなってるの?」とSlackで聞いた時に、基となるデータがしっかり蓄積されているので、ハルシネーションも起きずに、自動的に欲しい情報にたどり着けます。

川崎:いいですね。僕は英語のソースだったら、自動で日本語に翻訳して要約してもらってますね。

吉田:そうすると、本当に情報の取得スピードも速くなるし、一番正しい情報……二次翻訳されていない情報を持ってくることができるので。正しい情報をしっかり形に残せるという意味で、自動化はめちゃくちゃ大きいですよね。

休みなど不在の間の情報の入手も効率化できる

吉田:これに加えてもう1つ。今開発中なんですけれども、生成AIで1日の動きをまとめようとしています。右側に出しているのは、特定のチャンネルの、1日のやり取りがどうだったかという話のサマリーです。

川崎:おぉ、いいですね。

吉田:Slackの中でのコミュニケーションって、基本的にしゃべってるのと一緒だったりするので、非構造化データと言われています。会話データ、自然言語のまま読むのは冗長なので、しっかりまとめるのはけっこう大事です。ここまでまとめておくと「間でどういう会話があったか」がわかります。

川崎:休みの日とかにいいですよね。休んで復帰してきた時とかに「こんな感じか」ってすぐ見られますね(笑)。

吉田:まさにそうなんですよ。下に「深掘り」というボタンがあって、ここに入れると、実はチャットで質問ができるんですね。「ここをもうちょっと教えてほしい」ということが簡単にできるようになります。そうすると本当に休んだ次の日とかにとても便利に使えます。

川崎:おぉ、すごい。めちゃくちゃいいですね。これは詳しい人に「どうだった?」と聞いてるようなもんですね(笑)。

吉田:まさに、それを代わりにやってくれます。

川崎:すばらしい。本日はいろいろお話をうかがってまいりました。丈治さん、ありがとうございます。

生成AIでAI時代になって、どんな情報が蓄積されると、いつの間にかゴミ屋敷になるのかということも、ものすごくリアルに想像できましたし(笑)。情報をちゃんと蓄積して自動化することで、人間も楽になって、めちゃくちゃ効率の良い世界がやってくるのも、よくよくわかりました。

みなさまはどうお感じだったでしょうか? 丈治さん、本日はありがとうございました。