https://quadro.hateblo.jp/entry/kakonikki280

ブログバトン──生成AIとの1年間

ムッくんさんから「ブログバトン」を託されました。久しぶりの響きに、胸の奥がふっと温かくなりました。

ガラケーの時代、ああいう小さなやり取りが何だか嬉しくて、よく回していたなぁと懐かしく思い出します。

まさか二十年近く経って、同じような出来事がこのブログで再び巡ってくるなんて。偶然にしては優しすぎて、受け取らないわけにはいきませんでした。

いま体調は万全とは言えず、次の方へ綺麗につなげられるかは正直わかりません。それでも、預かったバトンだけはきちんと走り切りたい。そんな気持ちで、静かにキーボードを叩いています。

テーマはAI。難しく考えず、これまでどう関わってきたのか、そしてこれから触れていく初心者の方に何か一つでも残ればいい――そんな軽やかな気持ちで書いてみようと思います。

すべてをつなげようとは思っていません。ここで途切れてしまっても、きっとそれはそれで自然な流れ。バトンはバトンとして、今書けることを素直に置いていきます。

それでは下のお題にお答えしたいと思います。

受けさせてもらうブログバトンテーマ
生成ＡＩで、最もワクワクすることは何ですか？
普段ＡＩをどう使ってますか？
Google、Instagram、Tiktok、etc... 普段どんな方法で検索をしていますか？また、ＡＩを活用した検索を使っていますか？

最初生成ＡＩで、最もワクワクすることは何ですか？

生成AIに出会って、まだ1年ちょっと。

最初に感じたのは、驚きと、ちょっとした脱力感だった。

言葉を入れるだけで、手で描くよりずっと簡単に、写真みたいな画像ができてしまう。

ブログ記事にイラストをつけたくて、３年前から『クリップスタジオペイント』を買い、液タブを買い、iPad ProにApple Pencilまで揃えて準備をしていました。総額、軽く10万円は超えていたのです。

けれど、そのすべてが、いま段ボール箱の中で眠っている。

それはスマホで、なんとなく触ったAIと出会ってしまったからです。
なんともムダなことをしたと思ったのです。もう少し待てばよかった。数年先のことなんて

誰にもわからなかったのだから。

スマホ一台で、無料でここまでできてしまう。

そのことに、ワクワクした。同時に、少しだけ寂しくもなったことです。

普段ＡＩをどう使ってますか？

「普段、AIをどう使ってるんですか？」

そう聞かれることがある。

答えは、いたってシンプルだ。

忘れかけている思い出を、小説風に作り直す。それだけ。

それも、うれしい思い出ばかり。手帳に手書きで残したものではない。

インターネット初期の頃、２０年も前の、ネット上の日記サイトにテキストファイルで残していたもの、もう忘れかけているような思い出。

物語の構成を考えて、その場面に合う画像をつくる。

有料の高性能AIは使っていない。誰でも使える、低機能の無料版。やれることは、限りなく少ない。少なすぎると言ってもいい。

でも、工夫次第で何とかなる。無料で、どこまでできるのか。その"どこまで"を探すのが、おもしろいと思ったから。

この1年、AIを使いながら苦労したこと、工夫したこと。それを、少しずつ書いていきたいと思います。

20年前の断片を、もう一度

一年ほど前から、20年前の古いテキストを読み返している。

そこには、自分の言葉と気持ちの断片が眠っていた。

単語だけの行。途切れた短文。感情を残そうとして、うまく言葉にできなかった痕跡。思い出の欠片。

20年も経てば、ほとんど忘れている。あの頃のことを、自分の力だけで思い出すのは、もう難しい。

それを、AIで蘇らせる。

データがあるから、できること。頭の中の微かな記憶だけでは、できないこと。

下の画像は日記サイトの実際の日記、これは文字数が多く文章にはなっています。

■ 携帯サイト『GREE日記ブログ』

携帯サイト

（当時は、会社内で話す時は、誰かに聞かれてもごまかせるように、マユミのことを「紀香」というニックネームで呼んでいた。

藤原紀香がレオパレス21のCMやで人気の頃だった）

youtu.be

ほかの日記は二行だけでも、その時の情景を思い出せる。

けれど、ブログに二行だけ載せても、読者には意味が伝わらない。

だからまず断片を丁寧に拾い、ト書きを加えて短い文章の集合に整える。

そのうえでAIに渡し、読みやすい形に校閲してもらう。

最近、AI小説というジャンルを読んでみた。

単語や短文を投げて、あとはAIに自由に書かせる──それは簡単だ。

しかし、それでは僕が求めているものにはならない。

確かに、エンターテインメントとしては面白く仕上がるかもしれない。

実際、AI任せの小説だけを並べたブログもあったが、読む気にはなれなかった。

それと同じように作れば、僕の思い出とは無関係で、脚色が強く、現実とズレているからだ。

読んでも心に触れない。

僕がつくりたいのは娯楽ではなく、僕自身のドキュメントだ。

他の人にはつまらなく見えてもかまわない。

忘れかけていた過去をもう一度辿り、消えかけた記憶を形に残せることが大事だ。

文字だけより、目の前で再生される小さなドラマのように見えるほうが楽しく、後々の財産になる。

AIが仕立てた文章は必ず読み返す。

内容が変わっていないか確認し、足りなければ当時の記憶を足し、違和感は削る。

そのやり取りを繰り返すことで、物語は少しずつ輪郭を持ちはじめる。

まるで初校、二校、三校と進むような感覚で、AIと二人三脚で形にしていく。

最終稿を読み返すと、胸が熱くなることがある。

十行ほどの日記が、小説の一場面のような深みで戻ってくる。

確かに、昔の光景がよみがえる。

AIを使ってみて、この「文章を形にする」力には本当に驚かされた。
技術の進化をここまで実感したのは初めてだ。

もうひとつの驚き──文字で、絵を描く

そしてもうひとつ、感動的な機能がある。

文字で絵を描く、ということ。

これも、凄いことだった。

時間のかかる作画の仕事を、うまくいけば30秒もかからずに形にしてくれる。感動的な絵を作ってくれたときの驚きは、文章以上だった。

なんとも言えない、じーんとくる感覚があった。

画像づくりは、初稿では終わらない

文章が固まると、次はイメージづくりに移る。

こちらも、初稿で終わることはまずない。

文章をそのまま投げ込んで、理想の一枚が出てくれば、どれほど楽か。

でも、AIはまだ監督のようには動いてくれない。文脈から"構図の理由"や"表情の気配"までは、読み取ってくれない。

こちらが言葉で丁寧に導かなければ、意図とは違う世界へ迷い込んでしまう。

思えば、数年前には想像もしなかった作業だ。

最初につくったAI画像は、シンプルな文章をもとにした女の子のイラストだった。

過去の日記とはまったく関係のない、ブログ記事用の一枚。個性に関係ない女性のイラストに感情は湧かないのでただの挿し絵なのです。

AIは、言葉から連想される画像を、ネットの膨大な情報の中から拾い上げて、再合成して、提案してくる。

気に入れば採用する。違えば、やり直す。

その単純な工程の中に、小さな創作のよろこびがあった。

個性を作るためのプロンプト

ネットで調べていたら顔を固定するプロンプトの作り方がありました。

下の画像が顔を固定するためのプロンプトのテンプレートです。

■ 顔固定テンプレート

プロンプトテンプレート

最初はこれにいろいろと書き込んで『マユミ』をマユミの写真に近づけるためにプロンプトを考えて、試行錯誤してプロンプトを書き込みました。

プロンプトの表現は、やはり自分で考えた言葉が基本になります。

テンプレートに何をどう書くかで個性が千差万別になりますから、決まったことをテンプレートに書く分、毎回違う顔になる確率は減ると思います。

１人作成するのにこれだけのプロンプトを使用しします。

このプロンプトで三人がレストランで談笑するシーンを描こうとすると、すべてを細かく書き込むのは難しいと思います。

人物、背景、動作──三人分のプロンプトを書くだけで、すぐに相当な行数になってしまいます。

そのため、「マユミ」「ヒロ」「マキ」をそれぞれ別の設定として扱えたらいいのに、と感じました。

設定をプロンプトとは切り離して管理できれば理想的なのですが、どうやら有料アプリではそうした機能もあるようです。

人物設定を別で保存しておいて、背景や動作だけをプロンプトとして組めるようになれば、ずいぶんコンパクトにまとめられるはずです。

そうなれば、ブログの更新も体力やストレスを削らずに進められると感じています。
無料でも同じことができるようになればいいなと、つい願ってしまいます。

それに、3人で個性を持ちお芝居をしても、もっと緻密に高精細高解像度のリアルな人物の写真を作成できたかもしれません。

弱点もある──言葉探しの難しさ

生成AIの驚きとは別に、弱点もはっきりしている。

欲しい絵にたどり着くための"言葉探し"が、意外に難しいのだ。

こちらの表現がAIの学習データと噛み合えば、驚くほど的確な画像が生まれる。でも、少しでもズレると、まったく違う方向へ飛んでいく。

そこが、厄介で、おもしろい。

巷にあふれている、色っぽい女の子のポートレート。一人でにっこり笑っていたり、どこを見ているのかわからない表情だったり。

ああいう"被写体ひとり"の画像は、無料AIアプリでも、かなり細かくリアルにつくりやすい。

でも、僕がつくりたいのは違う。

ストーリー上の演出に使える、動きや表情。それを指示するだけで、かなりの文字数になる。

そこに、どうしても外せない登場人物が2人増えたら、プロンプトは単純に3倍に膨れ上がる。

プロンプトは上から優先されます。上から順に書き込んでいくと、あまりにも文字数が多いと下のほうのプロンプトは無視されるか、おかしな絵になることがある。

あまりにプロンプトが多いとまったく意図していない画像を出してくる。例えば画面の真ん中に外人の女性などを表示されたりする。

登場人物に個性を持たせることには、まだ限界を感じている。それに、人間のポーズの再現は難題だ。

正面か、斜めか。どちらに身体をひねっているのか。腕の高さ、視線の角度。上下左右、前後、東西南北……。

AIがどこまで立体を理解しているのか、こちらには読み切れない。

目の前にあるポーズを言葉だけで伝えて、まったく同じ形になったことは、一度もない。

それでも、この時間が愛おしい。

それでも、その不確かさごと、創作の一部になっていく。

断片の記憶を拾い上げて、言葉を探して、形にしていく。

その時間が、思い出をもう一度あたため直す作業になっているのだと思う、そういう１年間でした。

最後に、過去日記を始めた頃のプロンプトを必死に考えていた頃のプロントと、そのプロンプトをそのまま使用して、あらためて『ImageFX』で生成した画像を掲載しておきます。

どんな感じでプロンプトを作っていたか分かって面白いと思います。かなり素人っぽいプロンプトですのて、参考にはならないと思いますが、生成は出来ます。

プロンプト **女性の観察力（手の動き）**: 男性の顔を少し前かがみになりながら覗き込む。指で「ここ、クマがひどい」とデスクで仕事している男性の目の下を軽く指を付ける。 - **女性の表情**: 眉を寄せ、少し心配そうな目つきで男性を見つめる。その後、納得していないまま視線を外しつつも、「無理しないでね？」と言うときに、一瞬唇を噛む仕草。女性:*- この写真は、28歳の明るい肌の女性*1表情豊かな二重まぶた、大人で表情は穏やかで、少し笑顔を浮かべている、下を向いている。彼女の髪型はグランジヘア、前髪が少し長い、髪は自然な動きがあり、軽く波打っている。肩の下までの長い髪はサイドパートにレイヤーカットが入り、トップから内巻きの軽やかに動き、毛先が柔らかく整えられているの女性、 - ネイビーブルーの小さなスカーフリボンと金色の小さなボタンが3個付いたダークグレーのベストを着用、膝丈のダークネイビーのソックスを身に着けており、彼女のスレンダーな体型を強調しています。ほっそりとした体型を際立たせています。男性：スリムな体格の32歳のJポップ風の男性がモダンなオフィスチェアに座っている。彼は前髪のあるレイヤードショートヘアで、ダークグレーのスーツにダークネイビーのネクタイ、磨かれた黒の革靴を履いている。

■上のプロンプトによる生成画像

上のプロンプト1つですこれだけの画像が生み出されます。

プロンプト画像