創るためのAIはどう実現できるのか

徳井直生氏(以下、徳井):最後に、今日お話ししたことをまとめたいと思います。このスライドが今日の全体のまとめですね。

創るためのAIは、単なるツールでもなくて自律的な人間を置き換えるようなAIでもありません。その中間にある、人間がより創造的になるためのAIを実現するために何が必要かというと、「人or AI」ではなく、「人vs AI」でももちろんなく、「人×AI」、「人+AI」というマインドセットを持つことが大前提になるかなと思います。

それからAI DJで説明したように、過去のやり方や、過去のデータに固執せずに、AI化するプロセスの中で行為の本質をあらためて捉え直す、考え直すことが大事かなと思います。もしかしたらAI化する中で、実は今までやってきたやり方は唯一のやり方ではなくて、もっと新しいやり方や別のやり方があるということに気づくこともあるかもしれません。

僕はよく、「AIは鏡」だと言っています。つまり鏡があることで、自分の顔を映してよく見ることができる。AIを人間の考え方だったり、やり方だったりを映す鏡として使うことで、人間の知的なプロセスや思考のパターンをうまく観察することができると思っています。

3つ目として、フラメンコのプロジェクトやビートボックスのプロジェクトで紹介したように、逸脱や、間違いを取り込んでいくことが必要です。もちろん、必ずしもAIが犯す間違いがすべていいわけではないので、そこは人間が取捨選択して、いいものに関しては取り込んでいく姿勢が必要かなと思います。

裏を返すと、こういった創造的なシステムを創る場合は、おもしろい逸脱をどうやったら起こすかがポイントになります。これがランダムだと意味がないわけで。適度に半歩外側というんですかね。自分が知っているやり方やこれまでの領域の半歩外側みたいなものを意識する。そういうところにボールを投げてくれる確率を上げるにはどうしたらいいかをシステムを設計する時に考えておくのがいいかなと思います。

これは言うまでもないのですが、例えば自動運転とかの話はまた別ですよ。あれは間違いを起こしては困るので別の話です。創造的なプロセスに関してAIを使う場合、むしろおもしろい逸脱というものを歓迎すべきなのではないかと思っています。

4つ目が、AIを上手に誤用する。AIが得意な機能を転用することで模倣ではない新しい表現やアイデアを作るきっかけにつなげることができるのではないかと思います。

先ほどの写真のお話のように、人を模倣できるところはどんどんAIにやらせるのがいいと思います。きっと模倣する取り組みの中で、模倣しきれない部分が出てくるので、そこに注目する。そこにこそ、創造性の種が転がっていると信じています。

最後に僕が本当に好きな言葉をお送りして終わりたいなと思います。これはスコット・アダムスという……プログラマの方はもしかしたら知っているかもしれません。『ディルバート』というSEが主人公の四コマ漫画ですね。

この『ディルバード』の作者のスコット・アダムスさんが「創造性とは自分が間違いを犯すことを許すことで、どの間違いを残すかというのがアートだ」と言っています。

この観点でいうと、AIというのは間違いなく僕たちを創造的にしてくれるものだと思います。つまりおもしろい間違いを犯すことを許してくれるツールであると思います。一方で、どの間違いを残すかというアートの部分は、僕は人間側に残るし、残すべきだと信じています。

ということで、ちょうど1時間ちょっとくらいお話ししました。これ(『創るためのAI 機械と創造性のはてしない物語』)は400ページくらいあって、なかなか分厚いなと思われる方もいると思うのですが、絵や事例の紹介もたくさんあります。過去の作品をいろいろと紹介しているので、ぜひお手に取っていただければと思います。

最後にちょっと宣伝ですが、弊社では最先端のAIの取り組みを紹介するページを作っています。1つはCreate with AI、まさに創るためのAI、AIと創るというWebサイトで、人工知能を表現に活用している例を紹介しています。こちらも見てもらえればありがたいです。

また、Qosmo LabというタイトルでQosmoでのさまざまな取り組みの、どちらかというと裏側、技術的な背景を紹介しているサイトを運営しています。こちらも言語は日英で運営しているので、よければ覗いてみてください。Qosmo Labで検索すれば出てくるかなと思います。僕からは以上です。ありがとうございました。

ブラックボックス化しているソフトウェア

司会者:では、いくつか感想と質問をいただいているので、Q&Aセクションに入っていきたいと思います。私から感想や質問を投げかけて、徳井から回答いたします。

最初に感想を紹介します。「当たり前のような感想になってしまいますが、AIの今の状況は、コンピューターやインターネットが生活に入ってきた頃と似ている気がします。

その頃も、コンピューターを使うことは創造性がないみたいな話がありましたが、今はデザインや音楽をコンピューターでやることが当たり前になっています。創造性の概念も時代で変わっていくということなんでしょうね。揺らぎを許容するというのが、徳井さんのアーティストさを感じます。今はアートでも異端を許容しないというのが、多くなっている気がします」。

徳井:ありがとうございます。コンピューターやインターネットが生活に入ってきた頃と似ている気がするというのは、確かにおっしゃるとおりだなと思います。当時と似ている部分として、これはたぶん2000年くらいのことをおっしゃっているんだと思うのですが、コンピューターも、ソフトウェア自体の性能もまだまだ低くて、それこそよくクラッシュしたりしたと思います。その中を手探りでいろいろやってきた中で、当時新しい表現というのが生まれてきたと思います。

一方で、今どんどんAIによってソフトウェアが賢くなっています。それはいいことなのですが、逆に言うと、ブラックボックス化している部分も多いと思うんですよね。1クリックで音楽が生成できたり、1クリックで絵が生成できたりすると、創造性を萎縮させてしまう部分もあるのかな、つまり自分でコントロールできない部分が増えすぎてしまうこともあるのかなと、僕は懸念をしています。

これも誤用という言い方ができるのかもしれませんが、ソフトウェアを誤用する。本来の意味とはちょっと違う使い方をしてみる。そういった行為を許すゆるさをソフトウェアを作る人たちも意識していく必要があるのかなと思っています。

僕たちもAIを使ったツールを作っているわけですが、そのへんを意識しながら活動を続けていきたいなと思っています。

学習したモデルをあえて壊して、少し外れたものを生み出す

司会者:実は事前にも質問をいくつかいただいています。「近年AIアートと呼ばれるものが、その背景の仕組みやデータセットを踏まえずに見ると、似たようなビジュアルになっている現象が気になっています。

かつて、あえてデータを壊したり、プログラムをバグらせることによって予期しないビジュアルや音を獲得するグリッチやベンディングといった手法が注目されて、やがてそれがただのスタイルに収束してしまったこともありました。また、音楽の生成についても、仕組みを知らずに聞くと、チャンス・オペレーションとの違いが微妙なラインにあるのかなという気もします。

アウトプットとその背景の仕組みの提示の仕方をうまく設計しないと、容易にスタイルに改修されてしまい、本質的なComputational Creativityが換骨奪胎されてしまう気がしています。さまざまな実践を繰り返す中で、こうした点で気をつけていることはありますか?」。

徳井:すごいなぁ。難しい質問ですね(笑)。難しくていい質問ですね。ありがとうございます。

ベンディングのお話が質問の中にあったと思うのですが、ベンディングは実際にAIを使った作品でも存在しています。逸脱の手段としてベンディングをやって、つまり学習したモデルを壊すということですね。あえて壊すことをやって、少し外れたものが出てくるように意図的に仕向けるということは今もやられています。

AIを使う人間に才能は必要なのか

司会者:次の質問です。「創造という言葉は、過去の延長上の新しい作品と、今までにない新しい、いわゆる作風や、キュビズムのどちらとも取れますが、マシンラーニングの延長上のAIは前者にとどまって、後者を実現するきっかけ、加速、素材としての役割に使え得るというイメージでいます。だとすると、AIのそういう使い方を生み出せる人間に必要なのは、やはり才能なのでしょうか?」。

徳井:いい質問ですね。ありがとうございます。おっしゃるとおりで、創造性と一口に言っても、いくつか切り口があります。1つは、よく創造性研究で言われるP-creativityとH-creativityです。Hはhistoricalで、つまり人類史上初めてがH-creativity。例えばピカソだったり、スティーブ・ジョブズだったりの創造性のことです。

もうちょっと身近なcreativityが、personalなcreativityと言われるもので、例えば自分で新しい料理のレシピを考えたり、子どもが砂場で遊んでなにかを作ったりとか。あるいはビートルズの曲を自分でカバーしてみた、みたいなことも1つの創造性の表れだと言えると思います。

たぶんその間にグラデーションがあって、既存のスタイル、例えばJpopのスタイルで新しい曲を作るのも当然創造性です。質問にあったように、AIはそういった既存のスタイルの中で新しいものを作るのが得意だというのは、確かにおっしゃるとおりです。

そこから外れていくためには、人間が関与しなければいけないという部分は、確かにあります。才能が必要なのかで言うと、確かにある種の才能は必要だと思いますが、AIによって敷居が下がったと思います。

ここで必要とされている才能は、どちらかというと聞く才能、観る才能、つまりキュレーター的な才能が必要とされているのかなと思います。何度も言いましたが、既存のスタイルから外れたものは平たく言うと間違いなんですよね。

20世紀初頭の人からすると、ピカソの絵や、デュシャンの便器の作品は間違いですが、これをおもしろい、新しい、美しいとして選んでいった、その審美眼というか、キュレーション的なところが、たぶんピカソやデュシャンは非常に優れていて、ピカソに関しては、もちろん技術も優れていました。

エグゼキューションのところは、AIがわりとやってくれる。その中で出てきたものを取捨選択していく目利き力がもっと重要になるんだろうなと思います。そういう意味では、確かに才能は必要になると思うのですが、敷居を下げたとも言えると思っています。

AIと表現に関する研究はずっと続いていく

司会者:次の質問です。「創るためのAI以外のAI全般について、AIとは? AIがもたらしたものとは? について徳井さんの考えをお聞かせください」。

徳井:AIは、人間の知能を模倣する試みになると思いますが、僕はもうちょっとでうまくいきそう、もうちょっとで完璧に動作しそうなちょっと賢い振る舞いをするものみたいなイメージで捉えています。

温度を賢く調整してくれるエアコンのサーモスタットもAIといえばAIですよね。でも誰もAIと言いません。オセロのプログラムもAIとは言いません。それはなぜかというと、もう完璧に動くようになっているからです。オセロだと人間が絶対勝てないようになっています。

そうすると、あまり人はそういったプログラムやシステムのことをAIと言わなくなります。AIエフェクトと言われていますが、そういう効果があるかなと思います。

自動運転も今はAI研究と言われていますが、当たり前になったらAIとは言われなくなるのだろうなと思っています。よく、こういうAIと表現の研究をやっていますとか、こういう創作をやっていますと言うと、「AIがどんどん進んでいったらどうなるの? やることがなくなるんじゃないの?」と言う人がいますが、さっきも言ったように、AIはもうちょっとで完璧に動きそうな賢いものというふうに思っています。

その時代その時代の、まだ完璧にできていない、ある種の揺らぎが常にAIの周りには存在していると僕は思っているので、そういう意味で言うと、AIと表現に関する研究はずっと続いていくと思っています。

AIがもたらしたものに関しては先ほど言ったとおりですね。表現に関しては、エグゼキューションの部分は、実行する部分がわりと機械に任されるようになっていって、どんどん目利き力やキュレーションの部分が重要になってきている。これは表現の領域だけではなくて、いろいろな領域で当てはまることかなと思います。

GANとCLIPで生成される作品とNFTマーケット

司会者:次の質問です。「多くの作品には深層学習、深層生成モデルが使われていると思うのですが、AIがより自律的に動くような強化学習をもとにした研究や作品はありますか?」。

徳井:すばらしい質問ですね。強化学習は、途中で見せたカール・シムズの仮想生命体のプロジェクトが多少近いかなと思います。

直接的には強化学習とは違うのですが、強化学習を使った作品に僕も非常に興味を持っています。例えばこういった研究があります。申し上げたように強化学習ではないのですが、これはGANという仕組みで生成された絵です。

ここでは大きく2つの仕組みを使っています。1つはGANです。もう1つ、CLIPと言われるモデルを組み合わせています。これは、与えられたテキストと自分に入力されたモデルがどれくらい合っているかを評価するモデルです。

つまり画像生成のモデルが画家だとしたら、このクリップは批評家みたいなものですね。そうすると、例えば東京の街中を歩いていると入力すると、批評家であるクリップは、東京の街中っぽさを批評します。画像生成のモデルはクリップさんのお眼鏡に適うような絵を生成するために、どんどん絵を生成していきます。

上の画像が東京の街中を歩いている絵で、下の画像は、音楽好きにしかわからないのかもしれませんが、Aphex Twinというアーティストのアルバムジャケットをピカソが描いたらどうなるかという絵です。

「Perfumeが東京ドームでライブをやっている」と入力すると、こういう3人そろった絵が生成されます。批評と生成という関係が、お互いに競い合うことで最終的にこういった絵が出てくるところがおもしろいなと思っています。

さらに最近は、NFTの仕組みと絵の仕組みを組み合わせている人たちがいます。何をやるかというと、テキストのクリップさんのお眼鏡に適うだけではなくて、AIが生成したモデルをNFTのマーケットに出して、NFTのマーケットで売れたかどうかをフィードバックします。

それによって、自分のモデルのパラメーターをアップデートしていって、かつ、NFTが売れたらそれでAIが動くGPUのフィーを払うという、ある種の自律的なAIアーティストがNFTのマーケットとこういった仕組みを組み合わせて生まれてきているというのは、けっこうおもしろいトレンドだなと思っています。

直接的な強化学習ではありませんが、こういう事例があるということを紹介したいと思います。

学習データを意図的に少し崩してAIをより創造的に使う

司会者:最後の質問です。「AIをよりクリエイティビティにするために、データオーギュメンテーション手法を追求するような研究の方向性は存在しますか?」

徳井:これもすばらしい質問ですね。データオーギュメンテーションは、データの水増しと言われているものです。例えば画像認識のモデルを学習する時に、猫と犬を識別したいのであれば、それぞれの画像をたくさん集める必要があります。

ただ、画像がそんなに集まらなかった場合、あるいはたくさん集まったけれどもっと増やしたい場合に、あえて集めた画像をちょっと回転させたり、反転させたり、切り抜いたりすることで、いろいろな画像を1つの画像から作るというデータの水増しの手法です。

おっしゃるとおりで、よりクリエイティブにするために学習データをちょっと水増しします。単純に水増しするだけではなくて、例えば猫の画像を学習しているんだけど、そこに少し犬を足してみるとか。そういった学習データをミックスする手法はけっこうやられていると思います。

なんだかんだ言って、AIはデータがないと学習できないので、自分でたくさん写真を撮って、それを独自のデータセットとして扱うという取り組みをしている著名なアーティストの方もいます。

例えばチューリップの写真をひたすら集めていて、毎日チューリップをいろいろな角度からひたすら撮りためて、独自のデータセットとして、そこから画像生成用のモデルを学習して作品につなげているアーティストがいます。

学習データを意図的に少し崩すのは、AIをより創造的に使うという意味で非常に有益な手法だと思います。

司会者:すべてのご質問にお答えできずに心苦しいですが、時間になりましたのでこれで終わりにしたいと思います。ご参加いただいたみなさま、ありがとうございます。

徳井:ありがとうございました。