logmi・ログミー

世界をログする書き起こしメディア

日本語を理解するコンピュータの完成は100年先? AI小説家の生みの親が語る「言葉の力」の正体

日本語を理解するコンピュータの完成は100年先? AI小説家の生みの親が語る「言葉の力」の正体

“知のフロントランナー”と現役大学生が徹底討論する公開型授業『NISSAN presents FM Festival2017 未来授業~明日の日本人たちへ』が開催されました。第8回目となる今回は、松尾豊氏・山極壽一氏・川村元気氏のほか、伊藤博之氏や佐藤理史氏を講師に迎えます。“AI小説家”の開発者である佐藤氏が、コンピュータが言葉を操れるようになるまでの難しさや、言葉が持つ力について語りました。

シリーズ
NISSAN presents 『FM Festival 2017 未来授業~明日の日本人たちへ~』 > コンピュータが小説を書く日
2017年10月9日のログ
スピーカー
名古屋大学大学院 工学研究科 教授 佐藤理史 氏

コンピュータがセンター試験を受けてみた

佐藤理史氏(以下、佐藤) それでは「コンピュータは日本語が読めるか?」という話にしたいと思います。これもビデオがあるので、少し見ていただこうと思います。 (動画が流れる) はい。これは『東ロボプロジェクト』というプロジェクトのお話なんですが。これは東大の入試の試験を突破するような、ソフトやシステムをつくるということです。 一応2016年の中間目標として、センター試験で好成績、東大の足切りに引っかからない点を取るということになったんですけど、これは未達だったので、今かなりシュリンクしてしまったプロジェクトです。 我々のグループは実はいろんな科目をやってるんですけど、今日は国語の話を中心にします。「国語って、ちゃんと日本語を読めれば満点取れるよね? 例えば数学って、日本語読めただけで満点取れるとは思えないけど、国語って取れるよね? 本当にできるの?」ということを考えたわけです。実は大学入試って、やってみるとけっこうおもしろいです。みなさん苦労したかもしれないですけれども。数学とか理科とか社会とか国語とか、いろんな科目があるんですけれども、そこで問われていることは違うんですね。 数学は基本的に抽象的な世界について問われるんですけれども、例えば国語は、常識とか言語についての知識が問われます。時間が押してるので今はあんまり言いませんけれど。 国語の問題はセンター試験でA4の4ページから5ページぐらいの文章が与えられて、それの文章のどこかに傍線部が引かれていて、その傍線部とはどういうことなのか。その適切なものを次の5択から選べとか、こういう問題になるわけです。 基本的に日本語の問題なので日本語をちゃんと読めれば、きっと解けるでしょ? だからもしコンピュータが日本語をちゃんと読めるんだったら、解けて当たり前ですよね。でも我々の常識からすると、これはとてつもなく難しくて、ぜんぜん解けそうもないんです。

そもそも文章が読めるって何?

ただ、解けそうもないと言って引き下がるのは嫌なので、いろいろ工夫をいたしました。例えば本文のところから傍線部の近い、付近をとってきて、それと選択肢を比べて一番よく似ているものを出すとか、そんなような非常にいい加減な方法を実装いたしました。 ある研究者から「それはイカサマだ」と言われちゃったこともあるんですけど、そういうような方法を実装したと。(コンピュータは)どのぐらい国語ができるか。世の中の報道では、国語はぜんぜんできなかったと言うんですけれど、現代文に限って言うと、実は半分ぐらい解けます。 これは恐ろしい話なんですけれど。だいたい偏差値で言うと50ぐらいの点数がでます。ただプログラムをつくっている本人からしますと、このプログラムって文章理解してるの? ぜんぜん理解してません。でも、実は半分解けちゃうんです。 どうして? 半分ということは平均的な高校生と同じです。平均的な高校生って日本語ちゃんと理解してるの? よくよく考えてみると、文章が読めるとか、文章が理解できるということ自身、どういうことなのかよくわかんないんです。 何ができたら、その文章を理解したとか、わかったと言えるか自身がよくわかんないんです。それが今の技術レベルです。先ほど見せたスライドですけど、コンピュータは日本語を使いこなせるようになるか。 私の答え。コンピュータは今日本語がわかるかというと、わかりません。コンピュータに日本語がわかってるようなふりをさせることはできるか。これがこの10年、ものすごくうまくできるようになってきたんです。 一見、我々が言った言葉を理解してるようなふりをすることはできる。もう少し言うと、典型的な応答に関しては、非常にうまく答えてくれる。でもそこからちょっとでも逸脱すると、もうボロボロになってしまう。そういうようなところまではきた。

未来のコンピュータは日本語がわかるようになる?

いつか日本語が、このいつかというのは10年先じゃなくて、100年先ぐらいだと思っていただければいいと思うんですけれども。いつか日本語がわかるコンピュータがつくれるか。できないという理論的な根拠はないです。 正確に言うと、コンピュータサイエンティスト、コンピュータ科学をやってる人はだいたいこう答えると思います。できないという理論的な根拠はないと。ただし実際に、現実の技術的な見通しは立っていないと。こっちは私の意見です。 このようなことは信じられないかもしれないんですけれども、最近よい本が最近出ました。通称「イタチ本」と呼ばれています。『働きたくないイタチと言葉がわかるロボット』という本で、「言葉がわかる」ということのためには、最低限このことが必要だということで、実際に彼女は7つ挙げてるんですけど。 これが必要だということを(7つ)挙げて、それがどのぐらい難しいのか、今の技術レベルはどうなってるのかということを寓話で語るという。とてもよい本だと思いますので、こういうことに興味がある方は、ぜひ読んでいただければと思います。 「言葉ってとっても難しい。どうしてそれでも研究するの?」ということなんですけれど。おそらく、言葉は人類の最大の発明だと思います。我々の世界というのは言葉によって成り立っている。我々は言葉の世界に生きてると言っても過言ではない。 しかし、その仕組みは十分にわかっていないと。言葉というものの秘密に迫りたいと私たちが考えるのは、そこに私たちが生きる世界のすべてが、きっと含まれているからに違いない。そういうふうに思うからです。

小説の作者はコンピュータとプログラマーのどっち?

あと5分になりました。最後、またコンピュータと小説のお話に戻ろうと思います。実際我々が、あるいは私がやったことは、小説を生成するプログラムをつくったということです。それを動かすと小説が出力されます。 その小説をつくったのは誰ですか? コンピュータだと思う人は青、プログラマーだと思う人は赤を挙げてください。 赤が多い。かなり赤。はい、ありがとうございました。同じのを数独にします。数独の問題を生成するプログラムをつくった。それを動かすと数独の問題が出力された。この数独の問題は誰がつくったのか。コンピュータだと思う人は青、プログラマーだと思う人は赤。 さっきより青が増えた。はい、ありがとうございます。なんで数独の話をつくったかっていうと、実は小説をつくる前に数独のプログラムをつくったからなんです。実際にやってるのは、プログラマーとしてはやってることまったく同じです。 生成するための機械的な方法を、実際にプログラム化しただけです。それのプログラムを動かしてるだけです。まったく違いはありません。だから対象が小説なのか、対象が数独なのかの違いです。 そういうことを考えていくと、実際は誰がつくったかという問題はそれほど重要ではなくて、それは単なる受け手の認識の問題だと思います。最初に申し上げましたように、今のコンピュータというのは、単にプログラムを実行する機械で、それ以上のなにものでもないです。 ただ、そこで行われていることを、どういうふうに認識するかというのは人間側、受け手側の問題です。今のエグザンプルというのは、まさにそれを表していて。2つの質問で色を変えた方というのは、数独と小説で何か違う認識をしたということだと思います。

キーワードは「鑑賞力」

ただ実際、プログラマーからしてみると違う側面も見えてきます。数独を生成するプログラムという、これはぼくがつくったから全部わかってるわけですけれど。これはつくった数独の問題を解くことができます。その能力があります。 かつ、その数独の難易度、どのぐらい難しいのかというのを評価する能力もあります。ところが小説生成プログラムは、つくった小説が読めません。垂れ流してるだけです。そういう違いがあります。 ただし、これはほかの人からはまったくわかんないんですね。プログラムの動作を見てる人からは絶対わかりません。プログラマーだけが知っている真実なんです。 それで実際にこういうことを考えていくと、鑑賞力というのが、実はキーワードだ。そういうことになってきます。これは『舟唄』というショートショートがあるんですけど、これは音楽を聞くAIに、人間のピアニストが音楽を弾いて聞かせるお話なんですけれど。 先ほど出した本ですが、それの解説を書けと言われて、それを読んでちょっとぶっ飛んだわけです。我々は音楽をつくるプログラムはつくれるだろう、と思うんですけれど、音楽を聞いて楽しむプログラムつくれるか? そんなものはつくれないよなあと。 よくよく考えてみると、こんなふうになりました。これは解説に私が書いた文章なんですけれど。「読む人、聞く人、見る人がいて、はじめて小説、音楽、絵画は意味を持ちます。それらの作品は、受け取り手である人間に何らかの影響を与えることに本質的な意味があるのであって、作品自身はその媒体にすぎません。その影響を通して、私たちは作品を評価するのです」と。

人間の知性の根源は「言葉」

こう考えてくると今、人工知能と呼ばれてるシステムが成功してるのは、評価ができる問題です。将棋とか囲碁というのは、最終局面で勝敗がはっきりと、明確に定義されます。ですから、勝ち負けの判定プログラムをつくることができます。それに基づいて、中間状態の良し悪しというのを推測することができます。 もうちょっと飛んで、料理の美味しさを評価するシステムをつくれるか。きっとつくれるんじゃないかなあ、とぼくは思います。なぜなら、美味しさというものは、おそらくある種の物理量に還元できる。 つまり、塩分濃度とか物質の成分とか、そういうものに還元できるんじゃないかな、と思うわけです。ところが、小説のおもしろさを評価するシステムって、できないだろうなあと思うわけです。なぜならば、それは言葉がつくり出す仮想的な世界を内的に構成できないと、おそらく無理じゃないかなあ、と思うわけです。 言葉の力ということでまとめましたけれども、言葉の力というのは、実在しない世界をつくり出せること。仮想の世界、虚構の世界をつくり出せることだと思います。そして、その世界をほかの人に伝えることができること。信じさせることができること。それが言葉の力だと思います。 今、我々の社会を構成する重要なものに、貨幣とか国家とか宗教とかいうのもあるわけですが。それはおそらく言葉なしには成立しえないものだと思います。つまり、言葉こそが人類の知性の根源なのではないか、と思います。 実際、小説を書くというのはそれと同じことをやってるんじゃないかなあ、と最近思っています。つまり虚構の世界をつくりあげて、それを言葉として表現、言葉で表現して伝えること。これが小説の機能ではないかと思います。 小説というものをそう捉えるのであれば、おそらくそんなことは実現できるのは当面来ないと。ただし、誰かがつくった仮想世界を拝借して、それを言葉として表現する。例えばリプロダクションとか、ノベライゼーションとか。そういうことでいいとするならば、おそらくもうできてるんじゃないかなと思います。

言葉は無限のフロンティア

今回の人工知能のブームで、囲碁が非常にショッキングだったわけですけれど。囲碁の世界というのは、しょせん閉じた、とても小さな世界です。それに対して、言葉というのは非常に大きな世界で、かつこの世界自身が拡張していくことができます。 さらにそれに加えて、この言葉でつくりあげることができる虚構の世界というのは、おそらく無限に広がっています。人間はこういうことができる。この言葉を操ることができる。 これがもしコンピュータでもできるようになれば、つまりこれをやる機械的な方法がわかったならば、それは世界がひっくり返ります。ただしそれができないのであれば、おそらく社会はそんなに変わらないのではないか、と思います。 これは最後のスライドで、さっきのイタチ本の書評に書いたんですけれども。 「言語は、おそらくホモサピエンスが発明した最大の発明である。我々はその恩恵を受け、文明を築き、言葉の世界に生きている。しかし、我々が言葉を操る仕組み、言語というシステム自身、よくわかっていないのである。こんなに身近にある謎をどうして放置しておくことができよう。言葉こそフロンティアである」と。 今日来ていただいたみなさんの1人でも2人でも、言葉について興味を持っていただいて、この謎に迫る研究をやっていただく方が出ると、今日の私の講義は価値があったと思いたいと思います。どうもありがとうございました。 (会場拍手)

  
この話をシェアしよう!
シェア ツイート はてブ
日本語を理解するコンピュータの完成は100年先? AI小説家の生みの親が語る「言葉の力」の正体

話題のログ

編集部のオススメ

人気ログランキング

TOPへ戻る