ログイン

会員登録

検索

ログイン

メニュー

検索

ログイン

メニュー

Developer eXperience Day 2023

2023.06.14 - 2023.06.15

ChatGPTという現象、 LLMが開いたAI時代と日本の戦略（全3記事）

2023.07.28

メインカテゴリテクノロジー

「これまでのキャッチアップの遅さに比べると、今回の日本のスピードは悪くない」　日本のLLM開発が“国際的な競争力”を持つために必要なこと

リンクをコピー

記事をブックマークブックマーク解除

画像・スライド一覧

日本CTO協会が主催の「Developer eXperience Day 2023」は、“開発者体験” をテーマに、その知見・経験の共有とそれに関わる方々のコミュニケーションを目的としたカンファレンスです。ここで登壇したのは、東京大学の教授である松尾豊氏。LLMの技術的な概要について解説するとともに、今後の技術的な進展について発表しました。全3回。3回目は、民間企業・行政におけるChatGPT活用例と、LLM開発において必要なことについて。

従来あり得ないぐらいのスピード感で国も動いている

松尾豊氏：（スライドを示して）こういった技術の進展、ChatGPTという社会現象に対して、国も非常に急ピッチで動いています。かつてこんなに、最新の技術の変化に対して動きが速いことがあったのだろうかと思うぐらい、民間の経営者やスタートアップも含めて、本当に国全体が非常に速い動きをしていて、私はすばらしいことだなと思っているわけです。

2023年2月に自民党でAIPTが立ち上がりました。これは平議員（平将明衆議院議員）や塩崎議員（塩崎彰久衆議院議員）が中心となってできました。結果として、サム・アルトマンCEOが今週（※登壇当時）も来られていましたが、岸田総理（岸田文雄内閣総理大臣）と真っ先に会うということが起こりました。

それから、「AI戦略会議」というものが、2023年5月に立ち上がって、そこでわずか2週間で暫定的な論点整理を公表したということで、本当に従来あり得ないぐらいのスピード感で物事が進んでいます。

ちなみに、AI戦略会議でどういう論点が議論されたかを少し共有しておきます。

まず、リスクへの対応です。生成AIの技術はすばらしいのですが、やはりさまざまなリスクや懸念があります。そういったことに対して、きちんと対応していくことが重要です。

特に画像の生成AIに関しては、自分の作品が学習されて類似のものがたくさん作られるという被害、そういった状況にある方もいて、そういったことに対してどういった対応をしていくのか。ルールなのか技術なのか、そういったあたりも非常に重要だと思っています。

次に、AIの利用に関しては、生成AIをどんどん活用していくということで、民間でも政府機関でも率先して使っていくことが大事だということですね。

そして、開発に関しては、生成AIの基盤的な開発をしっかり進めていくほうがいいです。ただ、国がやるべきなのは、計算資源への投資だと思っていて、やはりLLMの開発自体は民間が中心になってやったほうがいいと思います。

先日も、私のインタビューの記事の中で、国がLLMの開発をすべきだという書かれ方がされていたのですが、ちょっと違っています。計算資源の投資、インフラの整備、それからデータの整備はすべきだと思いますが、LLMの開発自体はやはり民間中心にスピード感を持ってやっていくべきだと思っています。

AI技術に対する、社会づくりやルールづくりが議論されている

（スライドを示して）それから、G7で日本が中心になってリードして、AIの議論を進めていこうということで、「広島AIプロセス」を立ち上げることが発表されました。

チャットボットといったLLMや、画像のツールなど、こういったAIの技術に対してどういう仕組み、ルールを作っていくといいのか、どういう社会を作っていけばいいのかを議論していきましょうと。これを日本がリードしようというわけです。

当然、これは技術の話なので、技術がわかった上で、いろいろな議論をしないといけません。やはり技術者がきちんと、こういった話し合い、議論のプロセスに入っていくことは、とても大事なんじゃないかなと思っています。

（スライドを示して）それから、生成AIに関してはいろいろなリスクがあると言われるのですが、文化庁がさっそく5月30日に、「AIと著作権の関係等について」という資料を公開しました。これも非常に速いペースで、すばらしいと思います。

大きく、AIの開発・学習段階の話と、生成・利用段階の話の2つに分かれています。開発・学習段階のところは、著作権法第30条の4というのがあって、「著作権者の許諾なく利用することが可能」という例外規定があります。

ただし、必要と認められる限度を超える場合や、著作権者の利益を不当に害する場合は、この規定の対象にならないので、やはり悪意を持って、なにかコピーしようとか、類似のものを作ろうというのは、こういう対象にならない可能性があるという整理だと思います。

それから、生成・利用段階に関しても、生成AIを使って作ったものの中で、類似のものができることについては、通常の著作権侵害と同じく、類似性と依拠性の2つのポイントから判断がされるということです。

似ているかどうかと、既存の著作物を基に作られたものかという点で判断され、それがあれば、侵害になりますよということです。なので、使い方に関しては十分に気をつけてください。

これは、従来の著作権法の範囲内なので、生成AI特有ということではありません。従来の法律の範囲内でカバーできる部分はたくさんあるので、それをしっかり守ってくださいということですね。

ChatGPTを活用している民間企業の事例を紹介

そういった中で、各企業や組織がどう動くべきか？　という話をしていきたいと思います。先ほど、非常に速いペースで進んでいると話しました。

（スライドを示して）日本の大企業も非常に速いペースで進めていて、本当にこんなに動きが速くできるんだということで、すばらしいなと思っています。パナソニックやベネッセでは、社員が生成AIを活用できる仕組みを整えて、業務に使ってくださいということをやられています。

文章の生成やブレスト、議事録の作成など、いろいろな用途に用いることができて、生産性が上がりますよということが、すでにいろいろとトライアルされています。

（スライドを示して）それから、ChatGPTのAPIを使って、いろいろなサービスができるわけです。例えば「弁護士ドットコム」では、さっそく法律相談のチャットサービスを提供開始しています。

サイバーエージェントでは、画像の内容やさまざまな配信ターゲットに合わせて広告のコピーを生成しています。こういった活用の事例も続々と増えてきている状況だと思います。

行政でもChatGPTの活用は進んでいる

（スライドを示して）それから、民間企業だけではなく行政でも非常にスピードが速くて、横須賀市が全自治体で初めて、ChatGPTの活用を始めると4月18日に発表しています。

結果、かなり多くの職員が使っています。行政文書の作成などに活用されていて、これも非常に早い時期からやって成果を出しているということです。

（スライドを示して）これは、行政の別の例ですが、私の研究室も協力して一緒にやっている一例です。

「ごみ出しGPT」という通称で呼んでいますが、「ごみ出し案内」をするChatGPTを使ったサービスです。

ゴミを出す時に、今は20種類ぐらいカテゴリーがあって、どのゴミをどれに出したらいいのかがよくわからないというのを、自治体のホームページに書いてある情報を読み込んで、このゴミはどこに捨てればいいのか教えてくれるということです。

しかも多言語に対応していて、中国語でもスペイン語でもベトナム語でも聞けるということです。外国人の地域住民の方が、ゴミをきちんと出すことができない。そういう情報がわからないから困っているのですが、そういうことにも対応できるというのを、本当に開発からわずか1ヶ月ぐらいで実証実験を開始している状況です。

（スライドを示して）ちなみにこの仕組みは、役所のホームページのゴミの案内ページにあるPDFを読み込ませるだけなんですよね。それをプロンプトに入れて、質問に答えるので、仕組みとしてはめちゃくちゃ簡単です。もうあっという間にできます。

こういうことをやるための技術的なツールも、もうだいぶ前から整備されていますが、「LangChain」や「LlamaIndex」を使うと、組織内の文書をインデックス化しておいて、質問に関して検索をした文をプロンプトに入れて、質問に答えることもできます。

ChatGPTがいろいろなツールを選択して使うこともできるので、いろいろな活用の可能性があるということだと思います。

LLMの開発を“国際的な競争力”にするために必要なこと

（スライドを示して）LLMの開発自体も、今進んできています。LINEやソフトバンクが開発をすることを発表していますし、NTT、サイバーエージェントも作るということです。サイバーエージェントは、もうすでに大きなモデルを出しています。

あと、スタートアップのABEJA、ELYZAなどもこういったLLMの開発をやっています。それから、富士通、東工大といったところも表明しています。

こういった、LLM自体を作ろうという動きが、いろいろなところで出てきているのもすばらしいことだと思います。

小さいモデルは作ることができますし、オープンソースもあるので、いろいろなかたちでトライしていただければいいんじゃないかと思います。

こういった取り組みを、国際的な競争力にしていくにはどうしたらいいのか？　ということも、非常に重要な点じゃないかなと思っています。

（スライドを示して）1つ重要なことが、バーティカルのLLMがどのぐらいできるのか？　という話です。例えば、GoogleとDeepMindは、医療に特化した「Med-PaLM」を出しています。PaLMが一般的なモデルですが、Med-PaLMは医療に特化したモデルです。

医療領域において、こういうふうに医療のデータに特化したほうがいいのかどうかというのは、いろいろと論点がありますが、基本的には一般的な大規模言語モデルで医療系のデータでファインチューニングするよりも、医療のデータをきちんと事前に学習させておいて、ファインチューニングしたほうが精度が上がって、臨床医と同じぐらいの精度になるということです。

これは、ある種当たり前で、医療に使うのであれば医療のデータを最初から学習させておいたほうがいいという話ですよね。

ところが、難しいのがさらに大きな一般的な大規模言語モデルが出てきた時に、こっちのほうがさらに精度が上がることです。

なので、特化させない一般的な大規模言語モデル、それも巨大なやつのほうが、各領域で小さいものを作るよりも勝ってしまう可能性もあります。ということで、バーティカルなほうが勝つのか、あるいは本当に大きな巨大な1つのモデルが勝つのかというのは、なかなか意見が分かれるところだと思います。

それがどうなるかによって、本当にプラットフォーマーが出てくるのか、それともバーティカルなLLMや、ローカライズしたLLMが成立するのかもわかってくるんじゃないかなと思っています。

このあたりもまだまだわからないところなので、いろいろなチャレンジをしていくといいんじゃないかなと思っています。

LLMの技術はまだまだ黎明期

（スライドを示して）スライドはあと2ページですが、LLMの技術はまだまだ黎明期で、今後たくさんの課題が見えてくるし、また技術的なブレークスルーが出てくると思っています。

一見すると、今はLLMがなんでもできると思われがちですが、やはりある一定の限界がいずれ見えてくるはずです。

今、マルチモーダル画像も取り込んで答えられるというものがありますが、だいたいの場合は画像をトークン化して、言語と同じように扱います。

なので本質的な意味で、画像が入力されているわけではない。それから、この現実世界のセンサー、アクチュエーターの情報が入っているわけではないので、こういったあたりをどう読み込むかというのもあると思います。

また、直近で、大規模言語モデルの出力として、ブラウザの操作やソフトウェアの操作ができないかと。

要するに、ChatGPTが言葉で答えるだけではなく、実際にやってもらうということができないか？　というのがあります。先ほどの「LangChain」や「Toolformer」にはそういった技術があって限定的にはできますが、本当に複雑な仕事がどこまでできるのか？　というのは、技術的な課題だと思います。

それから、より長期的というか、より大きなタスク。例えば人間でいうと、半日や1週間かかるようなタスクを、こういったLLMで本当にできるのか？　とかですね。

そうなってくると、受け答えをするとだけではなく、実際に仕事をする、その結果からフィードバックを受けるみたいな、そういった学習も必要になってくるはずで、このへんはまだまだ、実は技術的にはできないところなんじゃないかなと思っています。

あと、データセットの話やバーティカルの話もありますが、そういったあたりでは、まだまだ技術としては黎明期です。

なので、逆に言うと、今後さらにビジネスとしての活用が広がってくる可能性が高いですし、だからこそ本当にスピード感を持って取り組んでいくべきだと思っています。

ということで、冒頭の人工知能の歴史の話で、第3次AIブームですと申し上げましたが、もう第4次だと言ってもいいんじゃないかと（思います）。そのくらい、2022年末からモードが変わっていて、すごいスピード感で時代が進んでいます。

日本のスピードも悪くない。これまでの技術のキャッチアップの遅さに比べると、相当いい線いっているんじゃないかなと思っています。

なので、こういうトライアルをぜひ続けてほしいと思いますし、自社の中で使う新規サービスを作る、LLM自体を開発する、いずれもぜひ積極的にやっていってもらえればと（思っています）。

こういったあたりは、CTOのみなさん方がリードしていくことだと思うので、ぜひ、いろいろなかたちで進めていってもらえればと思っています。

今の事業とまったく関係ない活用可能性も考えてもらいたい

最後に1つだけ重要なのが、このLLMは、ほとんどの事業のコスト削減や業務効率化ができます。なので、いったん自社内でどういう活用の仕方ができるかを考えてみる。ブレストをしたり、いろいろなかたちで検討するのはすごく大事ですし、そういった取り組みをやっていくべきだと思います。

一方で、どこに大きなビジネスチャンスがあるのかがわからないので、ぜひ、現在の事業とまったく関係ない活用可能性についても、考えてもらいたいと思います。

そういう中から、本当に大きな次の時代のGAFAMみたいなものが出てくるかもしれません。あまり現在の事業にこだわるのではなく、まぁ、こだわる部分も大事ですが、それとまったく関係なく考える、活用する、やってみるということも、ぜひやってもらえればいいんじゃないかなと思います。

いろいろなトライアル、こういうことをやって良かったよ、悪かったよというのを、ぜひいろいろなかたちで共有してもらえればと思いますし、そういう情報交換や、みんなで盛り上げていく中から、すごくいい取り組みやいい事業が生まれてくるんじゃないかなと思っているので、ぜひそういったかたちで進めてもらえればと思っています。

私からは以上です。ご清聴ありがとうございました。

【用語解説】

続きを読むには会員登録
（無料）が必要です。

会員登録していただくと、すべての記事が制限なく閲覧でき、
著者フォローや記事の保存機能など、便利な機能がご利用いただけます。

無料会員登録

会員の方はこちら