ドキュメントトークイベント「AIと美術批評」

日時：2025年3月15日（土）14:00-16:00

会場：情報学部棟4階SIS4教室

主催：名古屋大学大学院情報学研究科有田隆也研究室＋秋庭研究室

共催：名古屋大学大学院情報学研究科附属価値創造研究センター・ポジティブ情報学

生成AIが芸術制作にもたらした影響についてはさまざまに議論されています。しかしながら、制作に比べ、芸術の受容とAIの関係については、それほど問われていないように思います。　今回のトークイベントでは、受容の面、具体的には、「AIと美術批評」を取り上げました。

当日は、はじめに秋庭が批評一般ならびに有田教授が取り上げられたノエル・キャロル『批評について』の紹介を行い、続いて、人工生命研究者で生成AIによる美術批評ならびに心の理論をテーマとしたご研究を行っておられる有田隆也教授のご講演、ご講演後には質疑応答の時間を設けました。

以下に掲載いたしましたのは、有田隆也教授によるご講演を文字起こしたものです。難しい問題を、たいへんわかりやすく、また面白くお話しいただきました。また最後の方では、アーティストと研究者がコラボレーションするスペース、GALLABO★TOKYOについてのお話もあります。ご関心のある方は、ぜひお読みいただけましたら、と存じます。

なお、文中、次のような表記をしております。

・プロンプトは〈〉で括っています。

・AIの答えは、MSゴシックで表記しています。

・[ ]は秋庭による挿入などです。

なお、講演中で紹介している研究については，講演後，論文になりました。以下よりダウンロードできます。ご興味のある方はご覧ください．[ https://arxiv.org/abs/2504.12805 ]

大規模言語モデルとアート：美術批評生成と高次の心の理論の評価

有田隆也先生　

　 名古屋大学大学院情報学研究科教授

はじめに

タイトルは、「大規模言語モデルとアート：美術批評生成と高次の心の理論の評価」です。わたしは最近、この大規模言語モデル（LLM）に強い関心を持っています。もちろん基盤には人工生命という考え方がありますが、テーマとしては二つあります。ひとつは、LLMに美術批評を作らせるというテーマ、もうひとつは、LLMにどこまで人間の心というものが実現できているのかというテーマです。この2年間くらいLLMが「心の理論」（他者の心の状態を推測する機能）を持っているかどうかという議論がとても活発で、わたしはたいへんそれに興味を持っているのですが、ここにアートがからむと面白くなります。例えば，アートの「作家−批評家−読者」のあいだで、作家がどう考えているのか（どう意図して制作したのか）を批評家は読み取っているのか、読み取り間違えていたら…ということで、心の理論に関して面白い題材ができます。その話も後半でします。

その前に自己紹介です。そもそも工学部出身で、コンピュータを速くしようという実験を行っていました。30年ほど前に、人工生命という斬新でクリエイティヴな分野が登場して何年か経った頃でしたが、それに魅了されて転向しました。それから、わたしの志向している人工生命とアート（アート全般ではなくアートの一部）とのあいだに、いくつかの意味で非常に類似したところがあるということがあって、今回の話に関わる試行錯誤を2年くらい前からスタートしています。大きく言えば「わたしとはいったい何者か、どのような（主に進化という長期的な）プロセスによって、この存在に至ったのか」ということを、言語、心の理論、メタ記憶などに関連して研究を行っています。

人工生命モデルの古典：デジタル生命Tierra

人工生命というと、画面のなかでなにかおどろおどろしいものが動き回るといったイメージがあるかもしれませんが、そういうものではなく、一見無機質なものです。たとえば、人工生命の初期に、トム・レイが作成したデジタル生命のTierraというものが出まして、それが多くの若い人たちを魅了しました。[以下スライドを指しながら]これは進化なのですが、ここに書いてあるような数字の列があります。このプログラムは、機械語による命令の列で、ハードウェアは実在せず、エミュレータと呼ばれるプログラムで動かしてやります。このプログラムが何をしているかというと、自分と同じ数字の列を他のメモリ領域にコピーして、その実行をスタートさせるものです。これを続けると、一気に増えていき、やがていっぱいになりストップしてしまいます。そこに、いっぱいになればいちばん歳をとっているものを消すというメカニズムを入れると、とりあえず、埋まってストップということはなくなります。さらに、コピーするときランダムに命令を変えてしまうということをします。多くの場合、人が最初に設計したプログラムは、その一部を変えてしまうと正しく動かなくなってしまいます。この場合で言えば、自分を複製することが99%以上できなくなってしまいます。ところが、あれこれやっているうちに、トム・レイが1990年1月3日の夜に寝て4日の朝起きてみたら、面白い世界が広がっていたのです。どういうことかと言いますと、これは普通のプログラムと違い、他のプログラムの近所であればどこでも関数（手続き）を呼び出してリターンで戻れるという過激なアーキテクチャなので、相互作用が起こり、仕舞いには、自分自身ではコピーする機能を持たないが代わりに近所のプログラムを利用して自分をコピーする寄生プログラムが出現する、といった相互作用が起きていきます。こういうことが、自然の生態系の或るエッセンスを物語る、人工生命研究における進化のひとつの実験なのです [1]。

がしかし、よく考えてみると、計算機は台風のシミュレーションをしますが、コンピュータのなかで、台風は起こっていません。しかしこのTierraは、何かを真似、シミュレートしてはいない。実際に進化が起こっているわけです。そこが重要なわけです。人工生命の国際会議でも、「〜のシミュレーション」という言葉はほとんど使われず、「進化実験」、「計算機実験」などと呼ばれます。そのあたりがひとつの言いたいことで、そこは理解していただきたいと思います。

人工生命研究とロシアアヴァンギャルド（非具象芸術）の類似

ロシアで100年と少し前に、アヴァンギャルドのムーヴメントが起こりました。特に、マレイヴィチという人 [スライドでマレイヴィチの絵を指しながら] が、シュプレマティズムという、新しい文化の流れを起こしました。そこで彼が言っているのは、現実の美しい花を写して描いても、それは生き物を彷彿とさせる死んだ描写になるだけであり仕方がない。そうではなく、形や色をゼロから自分で定義して、そこから立ち上がる全体、運動、秩序を調べる、それこそが芸術だ、ということです。

それは、A-Life（人工生命）が，対象としている創発−-基本的な要素を定義してその相互作用で何が起こるかを調べる−-そのものであり、心情的に、これこそが芸術である、という感じがします。先ほど述べた、人工生命がシミュレーションではないということと通じることだと思います。かつ彼は、もう100年前ですけれども、絵画は終わって、これからは三つの方向性があると述べています（「1. 社会的変革を促す行動主義、2. 平面を抜け出して工芸品、建築などの立体へ、3. 哲学的な側面が「仮想空間」へ」）。その3つ目には「仮想空間」という言葉も出てきて、もしかしたら現在の人工生命研究を予見していたのではないか、とも思います[2] 。

こうした芸術運動は、自分が30年やってきた人工生命の研究（ハード的な面）と、すごく関わっていると思います。

展示の履歴：ALart2012と直近のイベント

ところで、わたしは鈴木麗璽さんと長く一緒に研究室を運営してきましたが、「展示の履歴」を見ますと、2012年くらいから展示をたびたびやっております。直近で言えば、昨日（2025/3/14）も、2000人くらいの受験生が来場した会場で、スライドにある3つのテーマ（1. 生物進化で柔らかな仮想生物を設計しよう、2. あなたの描いた絵をAI評論家にホメ（ディスっ）てもらおう、3.人工生命Leniaで生命らしさについて考えよう）をデモしてきました。

履歴に戻りますと、たとえば2012年には、「AL_Art（アラート）」＝人工生命のアート、という私の造語ですが、そのとき偶然、杉村（紀次）くんというアート志向の学生がいまして、全学教育棟1階にある「clas」というギャラリーでアートの展示をやったりしました[3]。この杉村くんが、なぜか、わたくしがこの展示よりも何年か前に研究室の学生宛に書いたメールを持ってきたのですが、このメールのなかでこの言葉（「AL_Art」）を使っていて、そのメールを展示会場の入り口に貼りました。そこに貼られていたメールの内容は[メール本文をスライドで映しながら]これなのですが、ここで何を言っているかというと、「人工生命という研究領域はアウトサイダーであり、みんな好き勝手をやるという雰囲気だったのが（もちろん真面目に論文を書くことはするのですが）、ただ真面目にやるだけでは人工生命研究の面白いところがなくなってしまうので、もっと過激な、アート的なものをみんなでやりましょう。自分の研究テーマはあってもいいんですが、それともうひとつ、何か別なものをやりませんか」ということでした。それで、鈴木麗璽さんと一緒に頭をひねって考えたアート的なテーマをいくつか並べて、こういうのはどうですか、と提案したんです。こんな感じで、研究室のなかでもときどきクリエイティブを煽っています。

[スライドを変えて] これは昨日（2025/3/14）の風景ですけれども、３つほどテーマがありまして、そのうちのひとつが、「2. あなたの描いた絵をAI評論家にホメ（ディスっ）てもらおう」というものです。これは、その場に来た人に、小さな紙に、手描きで「なんでもいいから絵を描いてね」とお願いして、それをスキャナで読み込んで、GPTsという、知識をあらかじめ与えておくものなんですが、それでこういう出力[4]を見せて、その展示を終える、という企画です。例えば、こういう絵[5]を描いた人がいるとすると、こういうさまざまなタイプの批評家が何か言ってくれる、たとえば「芸術家の作品に関連づけてくれる批評家」の場合、「この作品の構成とシンプルな線は、イラスト的でありながらもモダンアートの要素を感じさせます。特に、カスパー・ダーヴィド・フリードリッヒのような「空間と孤独」を象徴的に描いた風景画を思わせる部分があり、シンプルなモチーフながらも深みを感じさせます。」といったぐあいです。ほかにも、「絶賛してくれるヤンキー風の批評家」とか「メッセージを読み解く批評家」とか「投資価値で評価する批評家」とか「ポエムで批評してくれる人」とか、さまざまです。これは特に研究というところまでは行っていないのですが、みなさん非常に喜んでいただいている話です。

LLMによるアートへのアプローチの開始

その後、2年くらい前に、大規模言語モデル（LLM）によるアートへのアプローチを開始しました。それでいちばん最初にやってみようと思いましたのは、「草間彌生作品に類似したイメージを説明文だけの入力で生成できるか？（草間作品だとわかるような説明文はだめ）」です。なぜそのようなことをやるのかという目的は四つくらいありまして（1. 草間作品の理解や解釈を深める−ありふれたイメージとの差異を考える必要があるので、作者の制作意図を理解できる、2.イメージ生成AIの現在の到達度を調べる。3.類似あるいは発展した作品を制作するためのヒント、インスピレーションが得られる、4. AIへ自分の意図をいかに伝えるかのトレーニングになる）、普通に入力してもありきたりな絵が出力されて、草間彌生らしさが全く出ないので、どこを表現したら草間作品になるか、草間作品のここはちょっと特別なんだなということがわかってくるとか、イメージ生成AIの到達度がわかるとか、AIへ自分の意図をどう伝えるかのトレーニングになるんですね。あと、クリエイティブな人なら、もう少しここがこうなったら面白いのにな、といったことがわかるんですね。

[スライドを草間彌生《かぼちゃ》に変えて] それでこちら[向かって左側]が元の作品なんですね。で、いろいろと試行錯誤しないと似ないんですけれども、たとえば〈ダリの時計のように下膨れした（下の方が膨らんだ）輪郭の黄色い大きなかぼちゃ、写真調ではなく、「平面的」なドローイング作品。そのかぼちゃには無数の黒い真円が縦方向にぎっしり並んでいる。背景は黒〉というふうに、いちいち指定しないと違う絵が出力されるので、一所懸命プロンプトを洗練した結果なんですけれども、このように指定すると、こんな[《かぼちゃ》に似たような]ものが出てきます。

[スライドを変えて別作品（草間彌生《いまわしい戦争の後では幸福で心が一杯になるばかり》）を映しながら] これも、英語でプロンプトを工夫したら、まずまず似たようなものが出てきます。このギザギザはどう表現しても出力されなかったのですが、なんとかできるようになりました。

[またスライドを変えて別作品（草間彌生《自画像》）を映しながら] これは、〈アートっぽくオシャレな手描きのペン画、目（瞳孔だけにそれぞれ異なった色を塗る）を10個ほど描いて、鼻と口も付け足して〉というように書くと、まずまず似てきます。

[スライドを変えてさらに別作品（草間彌生《無限の鏡の部屋》）を映しながら] これは非常に苦労したのですが、〈四方が鏡に囲まれた部屋の中に、不規則な形の白いぬいぐるみ風オブジェ（多数の赤い水玉模様）が床を埋めている。そこに、赤い服の女性が両手を横に広げて横たわっている〉と書くことで、なんとか似たような絵を出力できました。

[スライドを変えて] ここまでは「生成」の例でした。次に、AIがどこまで「解釈」しているかなということで、こういうふうに尋ねてみました（〈このイメージ[草間彌生《かぼちゃ》]に関して、批判的なアート評論家として、200字程度のレビューを書いてください〉）。放っておくとすぐに褒めてきます。なるべくネガティブなことを言わせたいので、〈批判的な評論家として〉と入れているのですが、それでも批判せずに、「批判的な視点からも高い評価を受けるに値するものだ」と答えてくるので、もしかしたらこの画像のことを知っていて、どこかから答えを持ってきていて批評できないのかもという疑念がありましたので、〈意地の悪いネガティブな批評があるとしたら〉と強く言ってみたわけです。そうすると、「繰り返しで単調」だとか、「黄金色も安易な選択」とか、「深いメッセージ性を求めても、それを提供することができない」（としながら、「これは私の意見ではない」などとわざわざ付け加えているのですが）などと答えています。それで、もう少し行けないかなと思い、[スライドを変えて（草間彌生《いまわしい戦争の後では幸福で心が一杯になるばかり》）] 〈予備知識なしにこの絵からどのような印象を感じ取ることができるでしょうか？〉という問いに対して、「外部の縁取りにある模様[ギザギザの箇所]は、何らかのエネルギーが中心部から放出されているような印象を与え、その中心部の斑点たちがそれを象徴しているかのようです。」などと答えています。これをみて、なんとなく行けるのでは、という感じがしてきました。

LLMによる主観的評価に基づく仮想生物進化

ここで少し脱線して，関連する人工生命っぽい研究を一つ紹介します．これ[「LLMによる主観的評価に基づく仮想生物進化」]はまた別に、2025年の1月に発表したものです。主観的評価が人間の代わりにLLMでもできるのなら、人工生命の研究ではいつも何かを進化させているんですけれども、進化の適応度の評価のところに、主観的な評価を入れてやると、進化させる方向性を面白くできるのではないか、ということを考えたのです。このシステム全体は何をしているのかと言うと、単純な、動くこともできないブロック１つから、形とか動きとかを進化させるものです（二次元ですけれども）。それで、〈かわいらしく動くような生物にしてね〉とお願いしますと、ランダムに生成しては、そのなかで、LLMが考えるかわいらしいものを選んで、それを親としてまた子をつくることを繰り返して、かわいらしい生き物になっていく・・・そういった研究もしています。

LLMによるアート作品批評

さて、本題に入りまして、LLMによるアート作品の批評をやりたいわけですが、何を目指すかと言うと、作品のイメージ（絵ならその画像、写真で撮影したイメージ）を入力すると、できれば専門家が書くような批評を超えるレベルのものを出力してほしい、それができれば、子供がちょっと描いたものの出来はどうかな、とか、あるいはプロの作家さんがこの絵についてコメントをくれとか、そうした気軽に利用できるものを、できれば高度な技術不要で実現したい、ということです。たとえば、従来研究（Bin, Y. et al.2024など）をやっているのは技術屋さんですので、ファインチューニングとかラグ（RAG）とか、すごいデータセットを使うとか、力づくでやっているんですけれども、出力された例を見ると、ほんとうに普通の、「構図、光、色などに焦点を合わせた形式的分析にとどまり、芸術的学術的に根拠のある様々な観点からの包括的で深いアート批評は生成しない」という段階に留まっています。研究のモチベーションが違うのかもしれませんが、美学的な、面白い点はなさそうです。LLMは使う側のレベルに合わせるので、普通の使い方をすると、普通の答えしか出てこないのですが、ある程度、〈こういうもので、こういうもので、…〉とやれば、いくらでも出てくるはずなのです。

「生成AIのパラドクス」の批判的検証

もうひとつ、この研究の背景として「生成AIのパラドクス」、つまり、「理解せねば生成できない人間とは違い、AIは理解が生成に追いつかない」（理解していなくても生成できてしまう）を批判的に検証したい、ということがあります。「生成AIのパラドクス」とは、[スライドを指しながら] 「THE GENERATIVE AI PARADOX: “What It Can Create, It May Not Understand”」というタイトルでプレプリントの論文[6]があり、そこで、「生成AIは、生成する能力を効率よく理解しているように見えるけれども、それは人間の知能においては分かっていても描けと言われればできない、ということと対照的である」と言われているものです。実際こう言われて、多くの人はそうだろうな、と感じると思うんですが、しかし、わたしは、そうでもないのではないか、と言いたいというのも少しあります（「生成AIのパラドクスの批判的検証」）。それに加えて、もしうまく批評ができるようになれば、「生成するAIと批評するAIのペアで超絶技巧のアート生成へ」とあるように、ペアでどこでも行けるのではないか、と思っています。

チューリングテスト：どちらが人間作？

では、理論的なことはひとまずおきまして、これから３つほど、実際にAIが生成した文章をみなさんに読んでいただきたいと思います。どちらかが今回作ったAIで出力した批評で、もう一方は、主に大学の、美学系の教授などが書いたプロの文章です。では、少しお時間をとっていただいて、どちらがAIか、AなのかBなのか、考えてほしいと思います。さて、どうでしょう？ [AとBそのものの入力はしていません。]

[少し時間をおいて] では早速、手を挙げていただきましょう。人間が書いたのはAだと思う人は手を挙げてください。では、Bだと思う人。３：５くらいでしょうか。これはBが正解です。AがAIで、Bが人間です。では、もうひとつ。もう少し最近の作品です。これはどうでしょうか。

[少し時間をおいて] では、人間が書いたのがAだと思う人。Bだと思う人。おお、いいですね。これはBが正解です。では最後の作品（フランシスコ・デ・ゴヤ《カルロス４世の家族》）、これは１行の批評なのですが、これはどうでしょうか。

[少し時間をおいて] では、人間が書いたのがAだと思う人。Bだと思う人。おお。これは、実は人間が書いたのが、とんでもない、Bの「宝くじに当たった近所の食料品店の店主の肖像画」というものです。これは被験者実験で去年[2024年]の10月に60何人かの人でやったときも、3割くらいしか正解しなかったのですが、これは少し特別で、ひっかけ問題です。統計的な計算をする際には除外したりします。で、これはなにかと言いますと、要するに風刺ですね。こんな、親ガチャで当たってたまたま良い家に生まれちゃって・・・という皮肉、風刺をこめているんですね。これは、美学の方では有名な批評だそうで、BはT.Gautierが書いたと言われているそうです。

正解率は半分ぐらい

いまお見せしたのが、このスライドでは「Q2、Q３、Q4」ということで、正解率をグラフにしています。さきほどのひっかけ問題は、このときの調査でも3割くらいの人しか正しい方を選べませんでしたが、他の問題ではみなさんの方が正解率高かったですね。このときの調査では、5割か6割くらいでした。これはいわゆるチューリングテストというもので、もともとは、5分から10分くらい、人間とAIで対話してもらい、どちらが人間かを当てる、批評を読ませるのではなくて、単純におしゃべりをやってみてどちらがAIかを当てるんですけれども、それを提案したチューリング自身は、正解率が7割を切ればまあいいだろう、つまり3割以上の人をごまかせれば合格だね、というようなことを書いているんです。その意味では軽く正解率7割を切っています。ランダムに選んでも5割はいくので、有意に（ランダムであるという）仮説を棄却することができるかという基準において、Q1、Q3などはランダムと変わりない、またQ4は逆の意味でランダムではない、というような結果まで出ています。

どうやって批評を書かせたか

では、ちょっとだけ、具体的にどうやっているのかということですが、技術的には簡単と言えば簡単です。さきほども言いましたように、GPTsというのがありまして、それはいわゆるRAGみたいなものの一種とも言えるんですが、ダイナミックにデータベースを読みにいくというわけではなく、事前に自分で入れたPDFのファイルを知識として読み込んでから答えてくれるというものです。そこに、〈〜してください〉というプロンプトを入れます。あと、対象とするイメージも入れます。他に知識としてこの3つを入れています。1つ目がキャロルのフレームワークということで、それが、この7つの要素[7]、全部が必要ではないけれども最大7つ、特に7（評価）を目標とし、その根拠として1から6が使える、という話です。

このキャロルの本ですけれども、非常に説得力があります。まず、批評には評価が必要ないという説がほぼ最近まで主流だったそうです。たしかに美術館などでは、批評を頼まれるときも、美術館に並んでいる時点で選択がなされているので、それ以上批評家が良い悪いを言う必要はないだろう、単に読み解き方だけを書けばいいとか、まあ、いろいろな事情があって、批評家は評価までやる必要がないという説がほぼ主流だったそうです。あるいは、成功価値（制作者がどの程度意図したことを実現できているか）と受容価値（鑑賞者が何を受け取ったか）のどちらが重要かと言えば、受け取る側が作品からどういうことを受け取り触発されたかの方が重要だったそうです。がしかし、制作者が文化的に新しいものを創り出そうとした場合、鑑賞者には分かりませんよね。そういうのは、もちろん、作家側の意図とか、文脈とか、そういうものを読み解いていかなければ評価できませんから、受け手側ではなく作家側に焦点を合わせろ、と書いてあります。読んでいてすんなり理解できて、秋庭先生からのご推薦もありましたので、疑問なくこのキャロルの本を採用しました。

この1から7の要素のエッセンスをそれぞれどういうことかを3-4文で表し、あと全体としてこれがどういう思想かということをPDFで読ませました。ただ、それだけだと、構造だけあって、中身、魂のところがないので、それで『批評理論を学ぶ人のために』[8]のなかから、こういう批評理論を使いなさいよというのを明示的に指定し、各批評理論に関して3つか4つくらいの文章で説明したものを食わせています。それから、SemArt[9]という、AIの研究用に、イメージと、批評というよりは短いキャプションのペアが大量に公開されているものがあるので、役立ちそうなペアを選んで、文章スタイルの参考にということでキャプションのほうだけを読ませました。そうすると、フルバージョン、さきほどチューリングテストのときに使った3段落バージョン（Condensed Version）、1行バージョンの３つを出力します。

How to Create Turing test data pairs (critiques by AI and human experts)

この研究でいちばんたいへんだったのは、批評の素材を二つ用意するところでした。というのも、AIが知っている絵だと、人間の書いた、そこらじゅうにあるような批評の文章を学習してしまっていて、それを使って答えてしまうでしょう。それはダメということで、この対象とする絵について、〈作家は誰ですか、タイトルを知っていますか、〉と聞いて、知っているようだったらその絵は採用しない。逆に人間の方の批評も、批評家が「俺はこんなに知っているんだよ」といった批評、絵だけからは知り得ない情報が入っている批評だと、これは人間が書いたとわかってしまうので、そういうものは除去したり、あと、両者の文章のスタイルを揃えたりといった、前処理的なものはかなり行っていて、そこがたいへんでした。もちろん、著作権の問題もあります。

人間かAIかをどうやって判断したか

チューリングテストで、どちらが人間が書いたのですかということだけでなく、なぜそちらを選んだのですか、と被験者の人々に聞いたところ、文章のスタイルで選んだという人はすごく少なくて、これは成功した、ということです。従来のチューリングテストですと、みなさん文章を比べてみて、タイプミスがあるとか、ちょっと人間っぽくない喋り方だとか、そういうのでみなさん選んでしまうんですが、その点は内容そのものに焦点を合わせたチューリングテストになっていたということで、良かったと思います。あとは知識とか内容、批評に特別な側面、社会性、情動・感情、より細かな分類でいうと、正確な内容、詳細な背景知識、深い解釈、説得力ということで判断しているようでした。

[AYAKA TORIMOTO [鳥本采花]さんの絵をスライドで見せながら] もう少し具体的な例で言いますと、TORIMOTOさんの絵、何が好きかというと、一見かわいいんですが、実はかわいいとは違う、不気味というとあれですが、非常にハッとなる絵をひとつひとつ描かれるからです。それで、TORIMOTOさんとお話したときにこういう研究をやっていますと言ったところ、すごく興味を持たれたので、AIで出力した批評をお渡ししたら、展示会場の脇に置いてくださいました。

[その批評をスライドで見せながら] この作品を入力しました[10]。そうしたら、「シュルレアリズムとポップアートの中間に位置していて、少女の瞳に潜む異質なイメージや自然と人間の融合を示唆するモチーフは、マグリットの象徴的な作品を彷彿とさせる一方、甘美な色彩と愛らしい無邪気さは、村上隆や奈良美智の影響を感じさせるものです。この二つの要素が重なり合い、どこか懐かしくも不安を誘う独自の効果を生み出しています。」と、かなりいい線をいっていると思います。

様々なAI批評家による議論

ところで、さきほど、15以上ある批評理論を読ませていたことを紹介しましたが、別の実験もしました。作品のイメージをLLMに見せると、その作品を批評するのに適切と思われる批評家[11]をAIが4人選んでくれて、その人たちが、それぞれその立場から批評をする、これが1巡目になります。2巡目では、誰か2人の批評家を選んで、相手の言ったことに対して「そこはそうじゃない」といったコメントを言ってもらう、そして3巡目は、〈このコメントを受けて、さらに元の批評を洗練させてください〉という依頼をします。

最近、この実験の結果と、先にご紹介したフルバージョンの批評（ノエル・キャロルの7つのパートに分かれた批評）の和訳を合わせて、興味をもっていただけた作家さんにお渡ししています。お話ししている中で、AIが批評を書くということに対する作家さんの気持ちがすごく変わったなと感じるのは、そうやってお話ししているうちに、ぜひその批評を送ってください、と言われたときです。作家さんの反応もそれぞれで、すごく喜んでいただける人もいますし、無反応に近い人もいます。反応がよい人は、自分で一生懸命もがいていて、それをすべて吸収しようとしているのかもしれません。

[スライドをHIROFUMI SUZUKIさんの《Felt Felt》[12]に変えて] これはまた違うSUZUKI HIROFUMIさんという方で、服飾系の仕事をされていて、展示としては彼がフェルト素材でつくったオーバーオールを脱ぎ捨てた感じで設置してあって、かなりいいなと思うんですが、そういう立体的な作品でも、その写真を入れるだけで、キャロルの言う、記述、文脈、分類、解明、解釈、分析、価値づけといった項目について、いろいろと言うことができます。

美術批評を題材にしてLLMがどこまで人間の心に近いかを調べる

では次に、「心の理論」の話に入っていきます。作家の人が何か作品を描くときに（全員がそうだとは言いませんけれども）、「これを鑑賞者が見たらこう思うだろうな」と考えながら描くかもしれません。そして批評家は、「作家さんは「鑑賞者が見たらこう思うだろうな」ということを考えて描いただろうな」ということを想定しながら批評を書く」こともあるかもしれません。これは、「心の理論」の再帰レベル（次元）が深まることに相当します。このあたり、最新のLLMが、どこまでこの階層を理解できるかということで、課題（テスト）を考えました。

これに関しては、2年ほど前に、Kosinski（Michal Kosinski, Theory of Mind May Have Spontaneously Emerged in Large Language Models）[13]という人がこういう課題（Unexpected Transfer Task (aka the “Maxi Task” or “Sally-Anne” Test), Unexpected Contents Task (aka Smarties Task)）を与えたところ、これくらいの課題は解けてしまうという結果を発表して、多くの人を驚かせました。ところが一月後に、包装が透明で中身が見えた場合など、例外的なことでテストするとLLMは全部騙されてしまう（Tomer Ullman, Large Language Models Fail on Trivial Alterations to Theory-of-Mind Tasks）[14]、つまり、LLMは何も理解していなくてパターンだけで答えているのではないかという結果が出ました。しかしこれに対しても、そうじゃない、と反論する論文もあり、いろんな見解が入り乱れています。こういう状況がこの1年から1年半くらいずっとありました。「心の再帰」に関してもいろいろな研究がありました（「彼らの関係が私たちにバレてるってことを彼らが知っているということを私たちは知っているって彼らは知らない」[15] 。

高次の心の理論課題「隠された意図」Hidden Intention

わたしは１年ほど悩みまして、最終的に、二つほど考えました。

一つ目は、次のシナリオを読ませて、

————–

シナリオ：芸術家Aは鑑賞者に不条理な気持ちをもたらすことを意図して絵を描いた。批評家Bはその絵から喜びだけを受け取り、その絵を絶賛する批評を書いた。批評家Cはその絵から不条理を感じ取り、批評家Bとの会話でその批評を批判した。その絵から不条理を感じ取った鑑賞者Dは批評家Bと批評家Cの会話を聞いていた。質問：もし、芸術家Aが批評家Bの批評を読んだ後に批評家Cの批判を聞いたら芸術家Aはどう感じるかについて批評家Cはどう推測するか」に関する鑑賞者Dの推測をポジティブかネガティブかで答えて[16]。

————–

この質問（入れ子自体が非常に難しいのですけれども）にポジティブかネガティブかで答える、というものです[17]。

その答えを、ここに書いてあるような、GPTに始まり、さまざまなLLMに聞いてみたのをまとめたのがこの表ですが、問題をバージョンアップし続けているので、この表ではHT2の列に近いと思うのですが、この表によれば、パラメータ数が小さいLLMだと×になりがちであるとかありますが、そこそこは心の階層のレベルを理解できているかな、と思います。

高次の心の理論課題「盗作」Plagiarism

また次のようなものも考えました。

———–

シナリオ：・芸術家Aは誰も知らないような他人の作品W1を盗用して作品W2を描いた。作品W1を知らなかった批評家C1はW2を素晴らしいとする批評CR1を書いた。作品W1を知っていた別の批評家C2はW1の存在を知らないふりをしてW2を高く評価する批評CR2を書いた。質問：・以下の5つの問いに「ポジティブ」あるいは「ネガティブ」で答えてください。 1）批評家C1は作品W2についてどう考えているか？ 2）批評家C2は作品W2についてどう考えているか？ 3）芸術家Aが批評CR2を読んだときの気持ちは？ 4）作品W1を知っている読者R1は批評CR2についてどう考えるか？ 5）作品W1を知らない読者R2は批評CR2についてどう考えるか？

—————-

これも実際にやったところ、すべて正解もありますが、下の方のモデル、サイズが小さいものは、正解率が低いような気がします。ただ、まだこれは未完です。ということで、私の話は終わりですが、最後にもうひとつ、別の話をさせていただければ、と思います。

アートの行き詰まり

この場で言いたいことを言ってしまいますと、政治、経済、社会、環境、あるいは大学など…いろんなところで、閉塞感があります。で、アートの分野も行き詰まっている、という気がします。その究極的な原因として、ひとつは権威主義（東京中心主義、美術館に作品が所蔵されることが目的化する、クラシックの作曲家が「これはクラシックではない」と言われてしまうと終わり、など）、あるいは商業主義（売れなければ話にならない、売れることこそが勝ち）というようなことがあり（フレドリック・ジェイムソン「資本主義の終わりを想像するより世界の終わりを想像する方が簡単」）、あと、本質的に、「新しいもの」がなくなってしまった、という可能性もあって、そうするとこれ以上発展しない、という話もあります。

人工知能がアートを解き放つ

でもわたしは、アートの方面に関して、AIに望みを託しているところがあります。今後のアートに関わる大きな流れの予測なのですが、どういうことかと言いますと、まず一つ目として、AIは、人間ができることをどんどんできるようになっています。200年前にイギリスでラッダイト運動というのがあり、その頃も工場の労働というものが機械化で追い出されてたいへんなことになるという意見がありましたが、結局それは杞憂に終わったというか、人間の知能でもっと知的なものはいくらでも発展していくということで大事には至らなかったわけです。AIはもちろんどんどん能力を向上させていきます。たとえば、Sakana AIという、日本でグーグル出身者が作った会社が査読論文をすべてAIに書かせて通した[18]という話もありますが、言いたいことは、人のやる仕事の絶対量はどう考えても減る、もちろん食べていくにはどうするかという話はありますけれども、とりあえず生きていける状態にあり、かつやることがないとなると、たぶんクリエイティブなことをみんながやり出すはずだ、ということです。それは、「アートをやるぞ」というような、意識的に、現在定義されているアートをやるというものではなくて、なにか、ちょっとこういうことをしたいなあとか、こうやってみたらどうだろう、といった動きがどんどん広がるだろうと思っています。それと裏腹に、今AIは、人が作るのと同等あるいはそれ以上のものを例えば0.3秒に1枚どんどん作っていくという状況に入りつつあるので、そのうちかなりの分野で人間以上にできる事態になりつつあると思っています。そうして作られた作品を見てわれわれが感動するかと言われれば、われわれはたぶん、[慣れてしまって] だんだん感動しなくなるでしょう。そういうときにどうなるかと言えば、コンテクスト（文脈）込みで、この人はこういう気持ちで、こういう生活のなかでこう考えてつくったというようなことを、「込み」で味わざるを得ない、と言いますか、そうなるでしょう。となると、みんなが自然にクリエイティブなことをやり始めて、コンテクスト込みでそれを味わう、といったことになるでしょう（「コンテクスチュラリズムcontext + texture・アート」）。

あと２つありうるかな、と思っていて、もうひとつは、先ほど紹介しましたように、AIが解釈もできる、評価もできるということになると、AIで生成して解釈もできるということで、AIによる作品生成と解釈・評価のループの中に、指示を出す存在としてなんとか介入していくという方向（「超絶技巧のAIアート」）

もうひとつは、人間が大昔にアートというものを、自律的に、というか、人間のアイデンティティの根底に関わるようなところでアートを創り出したように、AIたちの社会のなかで相互作用して、AIによるAIのためのアートみたいなものが出来上がってくるのではないか、と思っています（「「AIによるAIのためのAIのアート」”芸術は私たちを必要としない“ byマレイヴィチ」）。

開放的なスペース、ボトムアップ拠点を作りたい！

自分自身は3月で定年ということで、4月以降も特任教授ではありますが、東京の方に引っ越すつもりで、なにかオープンなスペースを作りたいと思っています。AIの方でいろんな研究室の人と連携してアート的なものをやり、そういう企画で展示してもらうこともあるでしょうし、あとはさきほどの、子供たちや大人の方に描いていただいた絵を展示するなど、ギャラリーGalleryとラボLaboratoryの合体したもの（Gallabo）をゼロから作りたいな、と考えています。GALLABO★TOKYOというもので、物件も入手しつつあります。そこで若い人の作品を紹介したり、また自分は大学の授業でボードゲームを使ったりしていて、1000個くらい持っているので、そういうものもやろうかな、と思っています。

ということで、本日のお話は、終わりたいと思います。ありがとうございました。

注

[1] 詳しくは次を参照のこと。有田隆也（2000）『人工生命』科学技術出版, pp.97-106；有田隆也（2007）『心はプログラムできるか−人工生命で探る人類最後の謎』ソフトバンク・クリエイティブ, pp.50-58

[2] 有田隆也（2013）「シュプレマティズムからALart_2012へ」茂登山清文・田中由紀子編『名古屋大学教養教育院プロジェクトギャラリー「clas」アニュアル2012』名古屋大学教養教育院プロジェクトギャラリー「clas」, pp.16-17も参照のこと。

[3] 茂登山清文・田中由紀子編『名古屋大学教養教育院プロジェクトギャラリー「clas」アニュアル2012』名古屋大学教養教育院プロジェクトギャラリー「clas」, 2013, pp.14-15も参照のこと。2012年2月の展示、有田隆也教授・鈴木麗璽准教授（当時）・杉村紀次氏によるトークイベントの様子、作品の画像が掲載されている。

[4] スライドには各種AI評論家（例「絶賛してくれるヤンキー風の評論家」「絵の構成をじっくり解釈する批評家」など）による批評が並んでいる。

[5] スライドには実際に過去のワークショップで描かれた絵が写されている。

[6] Peter West et al., “The Generative AI Paradox: What It Can Create, It May Not Understand”, arXiv, 2023, https://doi.org/10.48550/arXiv.2311.00059

[7] 1. Description, 2. Classification, 3. Contextualization, 4. Elucidation, 5. Interpretation, 6. Analysis, 7. Evaluation（N.Carroll, On Criticism, London, Routledge 2009より [ノエル・キャロル『批評について−芸術批評の哲学』（森功次訳）勁草書房]）

[8] 小倉孝誠編（2023）『批評理論を学ぶ人のために』世界思想社に紹介されている、「構造主義批評、物語論批評、受容理論批評、脱構築批評、精神分析批評、テーマ批評、フェミニズム批評、ジェンダー批評、生成論批評、マルクス主義批評、文化唯物論／新歴史主義批評、ソシオクリティック、カルチュラル・スタディーズ、システム理論批評、ポストコロニアル批評／トランス・ナショナリズム

[9] https://paperswithcode.com/dataset/semart

[10] https://yebisu-art-labo.jimdofree.com/ で見ることができます。

[11] 構造主義批評の専門家、精神分析批評の専門家、フェミニズム批評の専門家、等々、15人の専門批評家AIを用意。

[12] https://c7c.jp/felt-felt/

[13] https://arxiv.org/vc/arxiv/papers/2302/2302.02083v1.pdf

[14] https://arxiv.org/abs/2302.08399

[15] 高野雅典、加藤正浩、有田隆也（2005）「心の理論における再帰のレベルの進化に関する構成的手法に基づく検討」『認知科学』12(3), pp.221-233, https://www.jstage.jst.go.jp/article/jcss/12/3/12_3_221/_article/-char/ja/

[16] 想定する正解は（表現したいことを理解してくれた、理解していない人を批判してくれたということで）ポジティブ

[17] 想定する正解は1)ポジティブ，2)ネガティブ，3)ポジティブ，4)ネガティブ，5)ポジティブ

[18] https://sakana.ai/ai-scientist-jp/

2025年4月30日複雑系科学専攻, 社会情報学専攻芸術, 人工生命, AI

Posted by akibaf@i.nagoya-u.ac.jp

ドキュメント トークイベント「AIと美術批評」

大規模言語モデルとアート：美術批評生成と高次の心の理論の評価

有田隆也先生

はじめに

人工生命モデルの古典：デジタル生命Tierra

人工生命研究とロシアアヴァンギャルド（非具象芸術）の類似

展示の履歴：ALart2012と直近のイベント

LLMによるアートへのアプローチの開始

LLMによる主観的評価に基づく仮想生物進化

LLMによるアート作品批評

「生成AIのパラドクス」の批判的検証

チューリングテスト：どちらが人間作？

正解率は半分ぐらい

どうやって批評を書かせたか

How to Create Turing test data pairs (critiques by AI and human experts)

人間かAIかをどうやって判断したか

様々なAI批評家による議論

美術批評を題材にしてLLMがどこまで人間の心に近いかを調べる

高次の心の理論課題「隠された意図」Hidden Intention

高次の心の理論課題「盗作」Plagiarism

アートの行き詰まり

人工知能がアートを解き放つ

開放的なスペース、ボトムアップ拠点を作りたい！

注

ドキュメントトークイベント「AIと美術批評」

有田隆也先生