特集・集中企画

生成系AIがもたらすのはユートピアか、それともディストピアか

第1回AIアートグランプリトークセッション「生成系AIの可能性と未来」レポート

第1回AIアートグランプリで行われたトークセッション「生成系AIの可能性と未来」

 去る3月12日に開催された、第1回「AIアートグランプリ」の最終審査会にあわせて行われたトークセッション「生成系AIの可能性と未来」では、生成系AIの可能性と未来、そして課題についてざっくばらんに話された。登壇したのは、AINOW編集長/Cinematorico COOのおざけん氏、スマートニュース株式会社執行役員メディア投資担当の川崎裕一氏、そして本誌でもおなじみ「しらいはかせ」こと、デジタルハリウッド大学大学院客員教授の白井曉彦氏。

 「AIアートグランプリ」は、AIを活用して作られた画像、漫画、動画、音楽、ゲームといったアート作品のコンテスト。作画AIや作曲AIなど、人間の芸術的想像力を高めるAIの進歩を受け、来るべき時代に人間とAIが共生し、人間がより自らの能力を拡張するためにAIを活用したアート作品を広く募集し、厳正な審査の上表彰するというイベントだ。

『1週間かかっていたリサーチが、半日や3時間で終わるくらいのインパクト』川崎氏

[おざけん氏]今回、AIアートグランプリということで、私たち3人でトークセッションさせていただければと思っております。このグランプリのテーマにもなっていますが、生成系AIの可能性と未来で、この異色の3人がお話させていただければと思います。

 簡単に私の自己紹介をさせていただきます。「人間とAIが共存する社会を作る」というビジョンで、2018年から「AINOW」というAIの専門メディアの編集長をしております。今までずっとAI系の取材を本当に毎年ずっとしてきたんですけれども、今までで一番大きい波が来ているなというのをすごく感じています。

「AINOW」編集長のおざけん氏

[白井氏]VRエンタテイメントシステム研究者です。マイコン・ベーシックマガジン世代であり、ドラゴンクエスト世代です。僕は基本的には写真技術の人間なのですが、人類史での写真の登場みたいなことが、AIが出たときとほぼ一緒だなと。

 ゲームグラフィックスや、バーチャルリアリティで博士号をとって、フランスでテーマパークを作ったり、日本科学未来館で展示物を作ったりしていました。そして大学の先生をしばらくやっていたのですが、創る人を創るっていう活動をずっとやっていて、今デジタルハリウッド大学と、それからグリーグループの株式会社REALITYという会社で、「REALITY」というアプリを研究開発して、スマホで繋がるメタバースの未来を作る研究をしています。

VRエンタテイメントシステム研究者の白井曉彦氏

 「Stable Diffusion」がリリースされてから、2カ月で2冊本を書いていまして、という本が一番有名で、10月28日に発売しました。「これはやべぇやつだな」ということを書籍に残して、色んな人に伝えて、このAIで神絵師になるみたいなことが当たり前になってほしいなと思っています。論文の解説をしながら、今すぐ手に取って映像を作れる、画像を作れる、それから面白いゲームを作っていくみたいなことのを刺激したいなと思って活動しているところです。

[川崎氏]ここにきて自分の役割を理解しました。どういうことかというと、白井さんの話聞くと、僕はこういう人と一緒に人生を過ごしてきたんですね。例えば株式会社はてなが創業する時の近藤淳也氏や、mixiの創業期の笠原健二氏とか、スマートニュース創業期の鈴木健氏とかが、白井さんに似たものをものすごく感じるというか。

 「モノを作りたいけど、一人でモノを作れない」。僕は対外的なコミュニケーション、具体的にはお金をどうやって集めてくるか、誰を引っ張ってくるかとか、そういうのをやってきた人間です。Twitterの自己紹介にも書いてあるのですが、株式会社はてなの創業をして、「モンスターストライク」が出る前のmixiに自分の会社を売却し、企業再生をして、今はスマートニュースにいてスマートニュースも広告事業を立ち上げて、ある程度の規模になった。そういう人間です。

スマートニュース株式会社の川崎裕一氏

 スマートニュースもmixiも、機械学習やディープラニングをやってきたのですが、僕自身はエンジニアじゃないので、自分の感覚としては「急に変わったな」みたいな感じがあります。すごく工数をかけて、時間をかけても、何も変わらなかったのに、突如変わったような感覚があるから、ぜひ聞きたいなと思っております。

 「ChatGPT」とか「NotionAI」とか使ってみると、僕とかリサーチャーの仕事ってものすごく少なくなるか、生き残りが大変だと思いますね。今日もこのためにリサーチをしたのですが、これまで1週間くらいかかっていたリサーチが、半日や3時間ぐらいで終わるくらいのインパクトです。

[おざけん氏]そのあたりどういうスキルが求められるか、というな話もできればと思います。

人間の創造性をAIが増強した作品が集まった「AIアートグランプリ」

[おざけん氏]ではここから大きく3つぐらいに分けてお話しさせていただければと思います。まずは最初に今日のグランプリの作品をご覧いただいて、どうだったのか感想を伺えればと思います。

[白井氏]どの作品も大好きで、どれが優勝してもおかしくないと思っています。審査員もビッグネームの方ですが、本描いたりとかテクニカルなことやっている側からしても、揃っている作品はすべてテクニカル面も、アート面も、パッション面も星5つレベルのものが揃っていて、来てよかったなと思います。

[おざけん氏]テクニカルな技術を感じる部分って、どのあたりなのかちょっとお伺いしたいのですが。

[白井氏]例えば、先ほどの地域振興アイドルを雑コラ風に作った作品(『渚の妖精ぎばさちゃん対キモノアゲハ』)も、絵は雑コラに見えるかもしれないけど、雑コラをわざわざ作ろうとしているんですよね。きれいになっちゃうところを、わざわざキャラクターの安定性だとか。「35モデル作りました」みたいなところも。普通の人にはわからない話かもしれないのですが、1モデルを作るのに2、3ギガぐらい使う、ハードディスクがパンパンになるようなことを、全キャラの、全シーンの、全衣装の、全カットのモデルをわざわざ作っている。このことに対して、「伝統工芸品の職人さんとかに対する「尊いな」という気持ちをもって見ていました。

『渚の妖精ぎばさちゃん対キモノアゲハ』

[川崎氏]最後の朱雀さんの作品を見ていて、僕はちょっとまた全く別な視点で、絵は描けないけど、ストーリーが描けて、それをさっきの「Midjourney」とかを使って出していくとか、プロンプトエンジニアリング的なアプローチでそれを重視していくとか。あとは頭の中にあるアイデアを「ChatGPT」と対話しながら、ブラッシュアップしていくとか。人間の創造性っていうのをサポートしてくれるという観点を強く感じました。

[おざけん氏]本当そうですよね、私も三宅陽一郎さんというゲームAIでとても有名な方を取材させていただいたことがあるのですが、自転車に乗ったら早く走れるようになるし、車に乗れば早く移動できるみたいな形で、近年のAIも新たにツールとして人間の能力を補強しているんみたいなことをおっしゃっていただいたことがあって、まさにそこに近いところなのかなというふうに思いました。

これまでのAIと今後のAIの使われ方

[おざけん氏]次は、本日のテーマ、生成型AIの可能性というところで、まず最初に、今までがどうだったのかというところをまずうかがっていかなければと思っています。「Stable Diffusion」であったり、「ChatGPT」が普及する前のAI技術をどのように捉えてどのように活用されていたのか、まず白井さんうかがってもよろしいでしょうか。

[白井氏]僕自身、出身が東京工業大学の知能システム科学というところで、まさにロボットを作ったり、知能ロボットを作ったり、ソフトロボット、ハードロボットみたいなやつを作ったり、シミュレーションを作ったりしていました。そういうサイエンスをやっている側だったんですね。ですので、サイバネティクスから来るVRとか、今のロボットみたいなところまでを僕はやっていましたと。実は最近のAI、AIって言っているものは、ほぼほぼデータマイニングから来ている人たちで、Pythonの人たちであって、データマイニングから何か役立つ金になりそうなものがないかと言っている側でした。我々からすると、それ根っこが違うんだってと、っていうところで一旦切ります。(笑)

[川崎氏]逆に言うと、そこはどういう根っこの違いなんでしょうか。確かにAIっていうと、昔は一括りにデータマイニングみたいなのが、確実にあったと思うんですけど、白井先生さんにとっての根っこっていうのはどこら辺にありますか?

[白井氏]さっき三宅さんのお話がありましたけど、サイバネティクスみたいな人間拡張みたいなのがあって、人間拡張、サイバネティクスって実はクーバネティス(ギリシア語で航海長または水先案内人の意)が語源で、それこそ人の代わりに司るみたいな。司るっていう神様なり人間なりをまずイメージしているから、人間たちがやってきた経済活動から何かゴミみたいなものから拾い集めるというのは全然根っこが違う。

[おざけん氏]いわゆる膨大なデータの中から何かというよりも、何か新しい可能性を加え、そこから生み出していくべきだったみたいなご意見ということですね。

[白井氏]そうですね。上向き成長技術で色んなところに枝葉が出て、枯れ葉がいっぱい積もり、その枯れ葉をLLMで醸成して、その間から生まれた新しい森の精が誕生、みたいなのが現在ですね。

[おざけん氏]ありがとうございます。川崎さんは今日ビジネスサイドとしてお話ししていただくことになるかと思いますが、AIのトレンドをどのように捉えられていますか?

[川崎氏]実際ビジネスサイドは普通のセールスやマーケティングの人が使うというのは、カスタマーサポートを学習させて、インターフェースは「LINE」やWebサイトのフォームとかで返してくるみたいなものっていうのをなぜかAIで呼ぶとかね、そういうのがあったりとか。

 あと広告のクリエイティブっていうのもパターン出しはできたんですよ。例えば「青汁の広告を作るときにこういうパターンを出して欲しい」はできたんですけど、組み合わせるのは一手間か二手間かかるみたいな状態でした。ですので、拡張はされていたのですが、想像性を刺激したり、対話しながらAプランを出してくれて、次にBプランを出してくれるというようなことができなかったから、今から見ればまさに自転車クラス、三輪車ぐらいだったのかもしれない。まだ使うには手間がかかるみたいな感じでしたね。

[おざけん氏]実際に今まで業務の中で「こんなの使っていたよ」とか何かあったりしますか?

[川崎氏]広告の審査ですね。薬事法、景品表示法ってめちゃくちゃ複雑なんですよね。もちろん専門家がいるんですけど、人間がイチイチ見ているんですよ。だけどAIに簡単なレビューをさせてから人間が見たら、エスカレーションが圧倒的に楽です。あとはサポート。個々の広告のガイドラインというのもFacebookのガイドライン、Twitterのガイドラインが全く違うとか、色んな法律とかガイドラインみたいなものっていうのを前捌きするのによく使われていましたね。

[おざけん氏]一言でまとめてしまうのであれば、部分最適化で活用が進んでいたみたいな気はするなと思います。例えばVRの領域とかで機械学習を使って何かやってみる、みたいな動きって、今までどんな動きがあったのか、何か具体的なものがあれば教えていただけますか?

[白井氏]めちゃくちゃ具体的なので言うと、「リップシンク」ですね。バーチャルYouTuberが喋ってイキイキと喋る技術の中に、口をパクパク動かせる技術っていうのがあるんですね。あれは完全に機械学習なんですよね。音声からアイウエオの口の形を作るとか、シーンの形を作るみたいなものは、実はすごい根幹的な技術でありますね。

「Stable Diffusion」が誰でも使えるのは激ヤバ

[おざけん氏]昨年から本当に生成系の話というのが本当によく聞かれるようになりました。今のいわゆる「Stable Diffusion」だったり、GPT周りのようないわゆる大規模なモデルというところすごく注目が深まっていますが、どのように可能性を見ていますか?

[白井氏]まず大規模モデルのAPIを公開して使うみたいなことは、OpenAIもやってきたし、もちろんマイクロソフトはかなりすごいものを持っています。ただそれにお金を出して使うとどうなるかみたいな話になると、例えばうちのサービスとかでユーザーさんが、かわいいVTuberロボットを作ったとしたら、「それ、誰がお金払うんでしたっけ?」と。それをAzureにどんどんお金払うためだけの無料サービスみたいなのを作るのはすごく難しい。

 それが「Stable Diffusion」の時代に、「これやばいことやっているよね」と思ったのは、そのモデルが普通にダウンロードして「git clone」コマンドで落ちてくるとか、ダウンロードして落ちてくるとか、「これ配っちゃっていいの?」みたいなものが落ちてくるし、しかもそれが普通のコンピューターで動く。おうちのパソコンとか下手するとスマホでも動くみたいな、それが本当の技術的な一番ヤバいポイントです。

[おざけん氏]なるほど。まさにお手持ちのパソコンとかスマートフォンぐらいの計算、処理速度で動くということなんですが、「今、それだからこそこんな変革が起きている」というふうに捉えていますか?

[白井氏]「Stable Diffusion」って一言で言うと、人類が今まで培ってきたありとあらゆる画像の知識を持っている神様なんですね。それはどれぐらいの神様かっていうと、バベルの塔ぐらいの神様です。天に届くような塔を作ったら、神様が怒って壊し、いろいろな言語に分かれてしまいましたみたいなのが、われわれが日本語だとかを使っている理由とされています。

 ところが、我々が日本語なり英語なりで、「かわいい女の子の絵を描いて」って言ったら、かわいい女の子の絵が出てきて、それは世界中の人たちが「あ、かわいい絵を描きたかったんだな、この人は」ってわかってしまう。言語が要らないっていう。それぐらいのものが、皆さんのお手持ちのコンピューターであるiPhoneあたりにダウンロードして、全人類の今までの知識が、普通にモデルとして対話可能に置かれているっていうのは、これはヤバいやつです。

すでに「ChatGPT」を使えば短時間である程度目安がつく程度のリサーチが可能

[おざけん氏]ここで具体化して伺いたいなと思いますが、川崎さんは普段色々なリサーチ業務などをされていらっしゃいますが、具体的にどのように使われていますか?

[川崎氏]今日ご質問いただく内容というものを、すべて「ChatGPT」に投げて返してもらって、それを何回もまたリジェネレートして自分が納得できる答えを出すと。そこからさらにここの企業のURLはどこだとか投げてまた返して確認させる、それを1つのページにまとめて、サマリーだけを伝える、みたいな使い方ですね。あとLLMモデルの2020年から2021年までの投資金額の日米の差、あとそのジェネレティブや特化した投資金額の差、それらに投資しているベンチャーキャピタルの上位十社といったものを、精度は担保できないが、ある程度の目安をつけられるという作業を一定水準まで、ものすごく短い時間でやれるっていうのはヤバいですね。

[白井氏]1つ付け加えておくと、それに対して駄目出しをするコストがゼロっていうのも大きいですよね。川崎さんの部下にそれをお願いして、「明日までに月曜日までのスライドをまとめてきてよ」って言って、AさんとBさんが、いやAさんのほうがいいでしょって言ったら、「この人と絶対仕事しない」と思われてしまうけど、「ChatGPT」なり、このAI生成は全く嫌な顔しないので。

[川崎氏]そうですね、そうそう。(笑)あと「1人ブレスト」っていうのを実際よくやっていますね。ブレストってある一定水準以上じゃないと、噛み合わないみたいなとこがあったりするじゃないですか。あと、幅の広がりっていうのも必要だったりするんだけど、そこに対してどのメンバーをアサインするかとか、どのテーマをやるのかって大変なんですよね。

[白井氏]シャドウボクシングじゃダメなんですよね。

[川崎氏]そう、だからそれをカウンターとして、それぞれちょっと癖のある「ChatGPT」とか「NotionAI」を使ってみようみたいなそういうので、癖がある者同士っていうのを気軽にすぐパッと、秒で集められるっていうのがすごくいいなって。

[白井氏]1つ美味しいサービスを教えます。めちゃめちゃすごく、まだツイッターのフォロワーが3桁しかいないんですけど、すごいサービスが「SlidesGPT」です。つまり我々がこういう講演会とかやんなきゃいけないんですけど、「今日はこういう講演会がある」って言うだけで、ザーッとタイトルから全部作って、「Google スライド」にしてダウンロードできる。

「SlidesGPT」

[おざけん氏]ホントにホワイトカラーまわりの仕事は、変わってくのかなと思います。

[川崎氏]しかもその差が、日本語であれ英語であれ中国語であれ、全く関係ないところがすごい。

生成系AIがもたらす未来はユートピアかディストピアか

[おざけん氏]ここで、今というところをどのように捉えられているのか伺ったんですが、この業界の未来みたいなところを、どのように描かれているのか、ゲームとかVRの領域で、白井さんに伺ってもよろしいでしょうか。

[白井氏]メタバースの研究開発している側からすると、ディストピア感も当然あるんだけれども、百花繚乱だと思います。先ほど触れたように、AIが仕事を奪うみたいなのはもう本当に古典でしかなくなっています。実際の一線のクリエイターさんたちがAIとコラボして神絵師になるみたいな世界観が当たり前でになるでしょう。「Stable Diffusion」のようなよくできたモデルみたいなものは、その森の精霊みたいなやつだから、仲良く付き合ったほうがよくて、そいつらと戦うとか、支配するように考えるよりは、どう共存していくみたいなことを考えられるかが一番、研究開発的には有用です。

[おざけん氏]報道でも「もはや人間がいらなくなるんじゃないか」みたいなのはありますけれども、それがあったら今日のグランプリは成り立ってないですからね。

[白井氏]今日のグランプリの方々っていうのは、「一線のクリエイターがこうやって使っているんだぞ」っていうのは、少なくとも、第1回アートグランプリとしては、意義深い瞬間だと思います。

ホワイトカラーは質問力が重要となる

[おざけん氏]ありがとうございます。川崎さんはいかがでしょう。これからどのように社会にインパクトを与えていくというふうに捉えられていらっしゃいますか?

[川崎氏]やっぱりホワイトカラーなくなるっていうのは、僕は白井さんと同じ文脈で「ないな」と。やっぱりこれほんとやってれば分かるけど、質問力が重要ですよね。どういう問いを持つか、だから予備知識、前捌きの知識っていうのにいかに獲得するかっていうこと。確かにAIから教えてもらうことは多々増えるでしょう、ただ、情報量が圧倒的に多いから、Googleで検索できるからすごく天才になったっていう人もいないと思うんですよ。

 同じようにAIに聞く力っていうのが重要。その先はこんなに広がってラッキーって思う。あと組み合わせ、「Stable Diffusion」とか、「ChatGPT」と組み合わせるとか。インターフェースがチャットだろうが、画像だろうが動画だろうが、それは個々の組み合わせで入力して出力するっていうパターンがたくさんあるっていう状態にできる。それがAPIを通じてっていうのがものすごく熱い。プログラム書けない人でも要件定義ができればプログラムコードが出てくる。それは未来感がありますよね。

[おざけん氏]私も同じように見ていて、一次情報をちゃんと得て、問いを立てられるのか、方向を決められるのか、みたいなスキルがすごく重要になってくると思いますね。

AIによって技術の格差は広がっていく

[おざけん氏]AIによってディストピアにはならないというのが、お二人ともほぼ共通した考えだと思います。しかし今後、初心者レベルの方々が淘汰され、逆にハイレイヤーの方がどんどん技術を使ってさらに上に行ってしまう、スキルの格差みたいなことが生じるような、課題がいくつかあるのかなと思ったりするんですけれども、そのあたりどう思われますか。

[白井氏]ドワンゴの川上さんとかが、コンテンツをたくさんの人たちが作れるようになるみたいなのは、一見ユートピアのようでいて、どこかに収束していくと彼は言っています。僕もちょっと補足すると、単価は下がっていくし、個性とかヘタクソとかは淘汰されていくしで、ウケるものにどんどんリソースが投下されていくでしょう。

 ただ、それはまだ通過点でしかなくて、どこかに収束したあげく、(車の)F1のように自分たちでエンジンが設計できて、自分たちで作りたいものに対して最初に手が動くみたいな状態で走り終わったときに、F3000とか乗用車とか、誰でも乗れる車とかという状態が来る。

 「今の流れについていくとか、作品出したところにはもう古い手法」みたいな課題を共通に持っている、今日のファイナリストはもう完全にF1。彼ら、F1をやっている人たちはとにかく走り続ける必要が今はあると思います。

[おざけん氏]なるほど、ありがとうございます。川崎さんはどう思われますか? そのスキルのある格差が今後大きくなっていくんじゃないのかというところ。

[川崎氏]僕もそこはあんまり楽観視しないですね。その差はもう広がるのは間違いない。
ただ白井さんの話に乗っかるとすると、誰かが先導していったら必ず伝播していくものだと思います。その先導者がもっともっと上に上がらなかったら、そもそもみんな浸透していかないみたいな部分はある。だから僕はある一定の差は認めるんです。ただその差を埋めるっていうことも必要だと思う。だから、明らかにこのAI、特に生成系AIっていうのはその差を埋めているのは間違いない、そういう見方もできると。

忌憚のない意見が交わされた

格差が広がった後に新しい変革が生まれる

[おざけん氏]こんなところが課題になるんじゃないかみたいなご意見、あればちょっと伺いたいなと思います。

[川崎氏]話の続きで言うと、とは言いながらAIにどういう質問をすると、どう返ってくるのかっていうことは短期的には絶対必要だと思います。それは何回も何回もジェネレイトするということに対しての躊躇のなさみたいなものがすごく重要になると思います。あるいはガチャ要素みたいなものがあるところが正直あると思います。

 だから人材については難しいことが2つあって、これによって単価が下がることによって、その職で食えなくなる可能性がある人は一定数いると。一方で新たに生まれる仕事もある。新たに仕事が生まれるというのは、どういう仕事なのか定義して人を募集するっていうのとか教育するのは、これはしばらく大変になるだろうなっていう気がします。

[おざけん氏]ありがとうございます。白井さんはいかがですか?

[白井氏]そうですね。写真技術を振り返ってみると、百数十年前に起きていて、今まで肖像画を描いていた画家が、写真の登場によって仕事を失うみたいな、当然今みたいな大変動が起きていたはずなんですよね。じゃあ彼らはどうしたかっていうと、俺たちは絵を描き続けるっていう人たちがいて、写真を撮ることにするという人たちもいて、各グループがさらに分かれるんです。

 写真家の中に「絵画みたいな写真撮るのをやめよう」っていう派が生まれるんですね。「俺たちは写真なんだから、もう少し街に出てスナップみたいなものを撮り始める」という純写真派みたいなのが生まれました。絵画は絵画で「よく見たら写真ってすごいけど、あれ、大きいものも作れないし、カラーも作れないよね」ということで、画材を開発し始める人たちがいて、チューブ絵の具が生まれて、街中で絵を描いたり、印象派が生まれました。

 川崎さんもおっしゃるとおり、ここからパラダイムシフトが生まれて、新しい変革が生まれる。今皆さんが使っている、例えば一眼レフとかもそちらにあるようなプロ用の機材とか、カメラはなくならないんですよね。それがどういう意味かっていうと、誰でも撮れるカメラとか、スマートフォンに吸収されてしまうカメラとか、スマートフォンの中の機能としてフィルター技術とか出てくるけれども、一方でプロのカメラ技術がなくなるわけでもないし、プロのカメラが要らなくなるわけでもない。

 それは皆さんがどこで生きていきたいか、何を生業としていきたいのかによって需要が違うからです。どうせ買うんだったらすごい一眼レフカメラが欲しいのか、すごいスマホが欲しいのか。それをいちいちディシジョン(意思決定)できるという状況にあるので、皆さんもアリのままに、もっと解像度高く物事を見ていただければと思います。

[おざけん氏]はい、ありがとうございます。決して、このトレンドを重く受け取り過ぎずに、今日のアートグランプリが成り立っているように、付加価値の付け方がイクラでもあるということだと思います。これを見ている皆さんも、ぜひご自身が今後どのような付加価値を付けていくのか、トレンドの中でぜひ考えていただけたらなというふうに思います。