日本語を理解するコンピュータの完成は100年先？　AI小説家の生みの親が語る「言葉の力」の正体

コンピュータがセンター試験を受けてみた

佐藤理史氏（以下、佐藤）：それでは「コンピュータは日本語が読めるか？」という話にしたいと思います。これもビデオがあるので、少し見ていただこうと思います。

（動画が流れる）

はい。これは『東ロボプロジェクト』というプロジェクトのお話なんですが。これは東大の入試の試験を突破するような、ソフトやシステムをつくるということです。

一応2016年の中間目標として、センター試験で好成績、東大の足切りに引っかからない点を取るということになったんですけど、これは未達だったので、今かなりシュリンクしてしまったプロジェクトです。

我々のグループは実はいろんな科目をやってるんですけど、今日は国語の話を中心にします。「国語って、ちゃんと日本語を読めれば満点取れるよね？　例えば数学って、日本語読めただけで満点取れるとは思えないけど、国語って取れるよね？　本当にできるの？」ということを考えたわけです。実は大学入試って、やってみるとけっこうおもしろいです。みなさん苦労したかもしれないですけれども。数学とか理科とか社会とか国語とか、いろんな科目があるんですけれども、そこで問われていることは違うんですね。

数学は基本的に抽象的な世界について問われるんですけれども、例えば国語は、常識とか言語についての知識が問われます。時間が押してるので今はあんまり言いませんけれど。

国語の問題はセンター試験でA4の4ページから5ページぐらいの文章が与えられて、それの文章のどこかに傍線部が引かれていて、その傍線部とはどういうことなのか。その適切なものを次の5択から選べとか、こういう問題になるわけです。

基本的に日本語の問題なので日本語をちゃんと読めれば、きっと解けるでしょ？　だからもしコンピュータが日本語をちゃんと読めるんだったら、解けて当たり前ですよね。でも我々の常識からすると、これはとてつもなく難しくて、ぜんぜん解けそうもないんです。

そもそも文章が読めるって何？

ただ、解けそうもないと言って引き下がるのは嫌なので、いろいろ工夫をいたしました。例えば本文のところから傍線部の近い、付近をとってきて、それと選択肢を比べて一番よく似ているものを出すとか、そんなような非常にいい加減な方法を実装いたしました。

ある研究者から「それはイカサマだ」と言われちゃったこともあるんですけど、そういうような方法を実装したと。（コンピュータは）どのぐらい国語ができるか。世の中の報道では、国語はぜんぜんできなかったと言うんですけれど、現代文に限って言うと、実は半分ぐらい解けます。

これは恐ろしい話なんですけれど。だいたい偏差値で言うと50ぐらいの点数がでます。ただプログラムをつくっている本人からしますと、このプログラムって文章理解してるの？　ぜんぜん理解してません。でも、実は半分解けちゃうんです。

どうして？　半分ということは平均的な高校生と同じです。平均的な高校生って日本語ちゃんと理解してるの？　よくよく考えてみると、文章が読めるとか、文章が理解できるということ自身、どういうことなのかよくわかんないんです。

何ができたら、その文章を理解したとか、わかったと言えるか自身がよくわかんないんです。それが今の技術レベルです。先ほど見せたスライドですけど、コンピュータは日本語を使いこなせるようになるか。

私の答え。コンピュータは今日本語がわかるかというと、わかりません。コンピュータに日本語がわかってるようなふりをさせることはできるか。これがこの10年、ものすごくうまくできるようになってきたんです。

一見、我々が言った言葉を理解してるようなふりをすることはできる。もう少し言うと、典型的な応答に関しては、非常にうまく答えてくれる。でもそこからちょっとでも逸脱すると、もうボロボロになってしまう。そういうようなところまではきた。

未来のコンピュータは日本語がわかるようになる？

いつか日本語が、このいつかというのは10年先じゃなくて、100年先ぐらいだと思っていただければいいと思うんですけれども。いつか日本語がわかるコンピュータがつくれるか。できないという理論的な根拠はないです。

正確に言うと、コンピュータサイエンティスト、コンピュータ科学をやってる人はだいたいこう答えると思います。できないという理論的な根拠はないと。ただし実際に、現実の技術的な見通しは立っていないと。こっちは私の意見です。

このようなことは信じられないかもしれないんですけれども、最近よい本が最近出ました。通称「イタチ本」と呼ばれています。『働きたくないイタチと言葉がわかるロボット』という本で、「言葉がわかる」ということのためには、最低限このことが必要だということで、実際に彼女は7つ挙げてるんですけど。

これが必要だということを（7つ）挙げて、それがどのぐらい難しいのか、今の技術レベルはどうなってるのかということを寓話で語るという。とてもよい本だと思いますので、こういうことに興味がある方は、ぜひ読んでいただければと思います。

「言葉ってとっても難しい。どうしてそれでも研究するの？」ということなんですけれど。おそらく、言葉は人類の最大の発明だと思います。我々の世界というのは言葉によって成り立っている。我々は言葉の世界に生きてると言っても過言ではない。

しかし、その仕組みは十分にわかっていないと。言葉というものの秘密に迫りたいと私たちが考えるのは、そこに私たちが生きる世界のすべてが、きっと含まれているからに違いない。そういうふうに思うからです。

小説の作者はコンピュータとプログラマーのどっち？

あと5分になりました。最後、またコンピュータと小説のお話に戻ろうと思います。実際我々が、あるいは私がやったことは、小説を生成するプログラムをつくったということです。それを動かすと小説が出力されます。

その小説をつくったのは誰ですか？　コンピュータだと思う人は青、プログラマーだと思う人は赤を挙げてください。

赤が多い。かなり赤。はい、ありがとうございました。同じのを数独にします。数独の問題を生成するプログラムをつくった。それを動かすと数独の問題が出力された。この数独の問題は誰がつくったのか。コンピュータだと思う人は青、プログラマーだと思う人は赤。

さっきより青が増えた。はい、ありがとうございます。なんで数独の話をつくったかっていうと、実は小説をつくる前に数独のプログラムをつくったからなんです。実際にやってるのは、プログラマーとしてはやってることまったく同じです。

生成するための機械的な方法を、実際にプログラム化しただけです。それのプログラムを動かしてるだけです。まったく違いはありません。だから対象が小説なのか、対象が数独なのかの違いです。

そういうことを考えていくと、実際は誰がつくったかという問題はそれほど重要ではなくて、それは単なる受け手の認識の問題だと思います。最初に申し上げましたように、今のコンピュータというのは、単にプログラムを実行する機械で、それ以上のなにものでもないです。

ただ、そこで行われていることを、どういうふうに認識するかというのは人間側、受け手側の問題です。今のエグザンプルというのは、まさにそれを表していて。2つの質問で色を変えた方というのは、数独と小説で何か違う認識をしたということだと思います。

キーワードは「鑑賞力」

ただ実際、プログラマーからしてみると違う側面も見えてきます。数独を生成するプログラムという、これはぼくがつくったから全部わかってるわけですけれど。これはつくった数独の問題を解くことができます。その能力があります。

かつ、その数独の難易度、どのぐらい難しいのかというのを評価する能力もあります。ところが小説生成プログラムは、つくった小説が読めません。垂れ流してるだけです。そういう違いがあります。

ただし、これはほかの人からはまったくわかんないんですね。プログラムの動作を見てる人からは絶対わかりません。プログラマーだけが知っている真実なんです。

それで実際にこういうことを考えていくと、鑑賞力というのが、実はキーワードだ。そういうことになってきます。これは『舟唄』というショートショートがあるんですけど、これは音楽を聞くAIに、人間のピアニストが音楽を弾いて聞かせるお話なんですけれど。

先ほど出した本ですが、それの解説を書けと言われて、それを読んでちょっとぶっ飛んだわけです。我々は音楽をつくるプログラムはつくれるだろう、と思うんですけれど、音楽を聞いて楽しむプログラムつくれるか？　そんなものはつくれないよなあと。

よくよく考えてみると、こんなふうになりました。これは解説に私が書いた文章なんですけれど。「読む人、聞く人、見る人がいて、はじめて小説、音楽、絵画は意味を持ちます。それらの作品は、受け取り手である人間に何らかの影響を与えることに本質的な意味があるのであって、作品自身はその媒体にすぎません。その影響を通して、私たちは作品を評価するのです」と。