以下の内容はhttps://quadro.hateblo.jp/entry/kakonikki280より取得しました。


バトンを受け継ぎ: 生成AIとの一年

ブログバトン──生成AIとの1年間

ムッくんさんから「ブログバトン」を託されました。久しぶりの響きに、胸の奥がふっと温かくなりました。

ガラケーの時代、ああいう小さなやり取りが何だか嬉しくて、よく回していたなぁと懐かしく思い出します。

まさか二十年近く経って、同じような出来事がこのブログで再び巡ってくるなんて。偶然にしては優しすぎて、受け取らないわけにはいきませんでした。

いま体調は万全とは言えず、次の方へ綺麗につなげられるかは正直わかりません。それでも、預かったバトンだけはきちんと走り切りたい。そんな気持ちで、静かにキーボードを叩いています。

テーマはAI。難しく考えず、これまでどう関わってきたのか、そしてこれから触れていく初心者の方に何か一つでも残ればいい――そんな軽やかな気持ちで書いてみようと思います。

すべてをつなげようとは思っていません。ここで途切れてしまっても、きっとそれはそれで自然な流れ。バトンはバトンとして、今書けることを素直に置いていきます。

それでは下のお題にお答えしたいと思います。

  • 受けさせてもらうブログバトンテーマ
  • 生成AIで、最もワクワクすることは何ですか?
  • 普段AIをどう使ってますか?
  • GoogleInstagramTiktok、etc... 普段どんな方法で検索をしていますか?また、AIを活用した検索を使っていますか?

 

最初生成AIで、最もワクワクすることは何ですか?

生成AIに出会って、まだ1年ちょっと。

最初に感じたのは、驚きと、ちょっとした脱力感だった。

言葉を入れるだけで、手で描くよりずっと簡単に、写真みたいな画像ができてしまう。

ブログ記事にイラストをつけたくて、3年前から『クリップスタジオペイント』を買い、液タブを買い、iPad ProにApple Pencilまで揃えて準備をしていました。総額、軽く10万円は超えていたのです。

けれど、そのすべてが、いま段ボール箱の中で眠っている。

それはスマホで、なんとなく触ったAIと出会ってしまったからです。
なんともムダなことをしたと思ったのです。もう少し待てばよかった。数年先のことなんて

誰にもわからなかったのだから。

スマホ一台で、無料でここまでできてしまう。

そのことに、ワクワクした。同時に、少しだけ寂しくもなったことです。

普段AIをどう使ってますか?

「普段、AIをどう使ってるんですか?」

そう聞かれることがある。

答えは、いたってシンプルだ。

忘れかけている思い出を、小説風に作り直す。それだけ。

それも、うれしい思い出ばかり。手帳に手書きで残したものではない。

インターネット初期の頃、20年も前の、ネット上の日記サイトにテキストファイルで残していたもの、もう忘れかけているような思い出。

物語の構成を考えて、その場面に合う画像をつくる。

有料の高性能AIは使っていない。誰でも使える、低機能の無料版。やれることは、限りなく少ない。少なすぎると言ってもいい。

でも、工夫次第で何とかなる。無料で、どこまでできるのか。その"どこまで"を探すのが、おもしろいと思ったから。

この1年、AIを使いながら苦労したこと、工夫したこと。それを、少しずつ書いていきたいと思います。

20年前の断片を、もう一度

一年ほど前から、20年前の古いテキストを読み返している。

そこには、自分の言葉と気持ちの断片が眠っていた。

単語だけの行。途切れた短文。感情を残そうとして、うまく言葉にできなかった痕跡。思い出の欠片。

20年も経てば、ほとんど忘れている。あの頃のことを、自分の力だけで思い出すのは、もう難しい。

それを、AIで蘇らせる。

データがあるから、できること。頭の中の微かな記憶だけでは、できないこと。

 

下の画像は日記サイトの実際の日記、これは文字数が多く文章にはなっています。

■ 携帯サイト『GREE日記ブログ』

携帯サイト

携帯サイト

(当時は、会社内で話す時は、誰かに聞かれてもごまかせるように、マユミのことを「紀香」というニックネームで呼んでいた。

藤原紀香レオパレス21のCMやで人気の頃だった)

youtu.be

 

ほかの日記は二行だけでも、その時の情景を思い出せる。

けれど、ブログに二行だけ載せても、読者には意味が伝わらない。

だからまず断片を丁寧に拾い、ト書きを加えて短い文章の集合に整える。

そのうえでAIに渡し、読みやすい形に校閲してもらう。

最近、AI小説というジャンルを読んでみた。

単語や短文を投げて、あとはAIに自由に書かせる──それは簡単だ。

しかし、それでは僕が求めているものにはならない。

確かに、エンターテインメントとしては面白く仕上がるかもしれない。

実際、AI任せの小説だけを並べたブログもあったが、読む気にはなれなかった。

それと同じように作れば、僕の思い出とは無関係で、脚色が強く、現実とズレているからだ。

読んでも心に触れない。

僕がつくりたいのは娯楽ではなく、僕自身のドキュメントだ。

他の人にはつまらなく見えてもかまわない。

忘れかけていた過去をもう一度辿り、消えかけた記憶を形に残せることが大事だ。

文字だけより、目の前で再生される小さなドラマのように見えるほうが楽しく、後々の財産になる。

AIが仕立てた文章は必ず読み返す。

内容が変わっていないか確認し、足りなければ当時の記憶を足し、違和感は削る。

そのやり取りを繰り返すことで、物語は少しずつ輪郭を持ちはじめる。

まるで初校、二校、三校と進むような感覚で、AIと二人三脚で形にしていく。

最終稿を読み返すと、胸が熱くなることがある。

十行ほどの日記が、小説の一場面のような深みで戻ってくる。

確かに、昔の光景がよみがえる。

AIを使ってみて、この「文章を形にする」力には本当に驚かされた。
技術の進化をここまで実感したのは初めてだ。

もうひとつの驚き──文字で、絵を描く

そしてもうひとつ、感動的な機能がある。

文字で絵を描く、ということ。

これも、凄いことだった。

時間のかかる作画の仕事を、うまくいけば30秒もかからずに形にしてくれる。感動的な絵を作ってくれたときの驚きは、文章以上だった。

なんとも言えない、じーんとくる感覚があった。

画像づくりは、初稿では終わらない

文章が固まると、次はイメージづくりに移る。

こちらも、初稿で終わることはまずない。

文章をそのまま投げ込んで、理想の一枚が出てくれば、どれほど楽か。

でも、AIはまだ監督のようには動いてくれない。文脈から"構図の理由"や"表情の気配"までは、読み取ってくれない。

こちらが言葉で丁寧に導かなければ、意図とは違う世界へ迷い込んでしまう。

思えば、数年前には想像もしなかった作業だ。

最初につくったAI画像は、シンプルな文章をもとにした女の子のイラストだった。

過去の日記とはまったく関係のない、ブログ記事用の一枚。個性に関係ない女性のイラストに感情は湧かないのでただの挿し絵なのです。

AIは、言葉から連想される画像を、ネットの膨大な情報の中から拾い上げて、再合成して、提案してくる。

気に入れば採用する。違えば、やり直す。

その単純な工程の中に、小さな創作のよろこびがあった。

 

個性を作るためのプロンプト

ネットで調べていたら顔を固定するプロンプトの作り方がありました。

下の画像が顔を固定するためのプロンプトのテンプレートです。

■ 顔固定テンプレート

プロンプトテンプレート

プロンプトテンプレート

最初はこれにいろいろと書き込んで『マユミ』をマユミの写真に近づけるためにプロンプトを考えて、試行錯誤してプロンプトを書き込みました。

プロンプトの表現は、やはり自分で考えた言葉が基本になります。

テンプレートに何をどう書くかで個性が千差万別になりますから、決まったことをテンプレートに書く分、毎回違う顔になる確率は減ると思います。

1人作成するのにこれだけのプロンプトを使用しします。

このプロンプトで三人がレストランで談笑するシーンを描こうとすると、すべてを細かく書き込むのは難しいと思います。

人物、背景、動作──三人分のプロンプトを書くだけで、すぐに相当な行数になってしまいます。

そのため、「マユミ」「ヒロ」「マキ」をそれぞれ別の設定として扱えたらいいのに、と感じました。

設定をプロンプトとは切り離して管理できれば理想的なのですが、どうやら有料アプリではそうした機能もあるようです。

人物設定を別で保存しておいて、背景や動作だけをプロンプトとして組めるようになれば、ずいぶんコンパクトにまとめられるはずです。

そうなれば、ブログの更新も体力やストレスを削らずに進められると感じています。
無料でも同じことができるようになればいいなと、つい願ってしまいます。

それに、3人で個性を持ちお芝居をしても、もっと緻密に高精細高解像度のリアルな人物の写真を作成できたかもしれません。

弱点もある──言葉探しの難しさ

生成AIの驚きとは別に、弱点もはっきりしている。

欲しい絵にたどり着くための"言葉探し"が、意外に難しいのだ。

こちらの表現がAIの学習データと噛み合えば、驚くほど的確な画像が生まれる。でも、少しでもズレると、まったく違う方向へ飛んでいく。

そこが、厄介で、おもしろい。

巷にあふれている、色っぽい女の子のポートレート。一人でにっこり笑っていたり、どこを見ているのかわからない表情だったり。

ああいう"被写体ひとり"の画像は、無料AIアプリでも、かなり細かくリアルにつくりやすい。

でも、僕がつくりたいのは違う。

ストーリー上の演出に使える、動きや表情。それを指示するだけで、かなりの文字数になる。

そこに、どうしても外せない登場人物が2人増えたら、プロンプトは単純に3倍に膨れ上がる。

プロンプトは上から優先されます。上から順に書き込んでいくと、あまりにも文字数が多いと下のほうのプロンプトは無視されるか、おかしな絵になることがある。

あまりにプロンプトが多いとまったく意図していない画像を出してくる。例えば画面の真ん中に外人の女性などを表示されたりする。

登場人物に個性を持たせることには、まだ限界を感じている。それに、人間のポーズの再現は難題だ。

正面か、斜めか。どちらに身体をひねっているのか。腕の高さ、視線の角度。上下左右、前後、東西南北……。

AIがどこまで立体を理解しているのか、こちらには読み切れない。

目の前にあるポーズを言葉だけで伝えて、まったく同じ形になったことは、一度もない。

それでも、この時間が愛おしい。

それでも、その不確かさごと、創作の一部になっていく。

断片の記憶を拾い上げて、言葉を探して、形にしていく。

その時間が、思い出をもう一度あたため直す作業になっているのだと思う、そういう1年間でした。

最後に、過去日記を始めた頃のプロンプトを必死に考えていた頃のプロントと、そのプロンプトをそのまま使用して、あらためて『ImageFX』で生成した画像を掲載しておきます。

どんな感じでプロンプトを作っていたか分かって面白いと思います。かなり素人っぽいプロンプトですのて、参考にはならないと思いますが、生成は出来ます。

 

プロンプト **女性の観察力(手の動き)**: 男性の顔を少し前かがみになりながら覗き込む。指で「ここ、クマがひどい」とデスクで仕事している男性の目の下を軽く指を付ける。 - **女性の表情**: 眉を寄せ、少し心配そうな目つきで男性を見つめる。その後、納得していないまま視線を外しつつも、「無理しないでね?」と言うときに、一瞬唇を噛む仕草。女性:*- この写真は、28歳の明るい肌の女性*1表情豊かな二重まぶた、大人で表情は穏やかで、少し笑顔を浮かべている、下を向いている。彼女の髪型はグランジヘア、前髪が少し長い、髪は自然な動きがあり、軽く波打っている。 肩の下までの長い髪はサイドパートにレイヤーカットが入り、トップから内巻きの軽やかに動き、毛先が柔らかく整えられているの女性、 - ネイビーブルーの小さなスカーフリボンと金色の小さなボタンが3個付いたダークグレーのベストを着用、膝丈のダークネイビーのソックスを身に着けており、彼女のスレンダーな体型を強調しています。ほっそりとした体型を際立たせています。男性:スリムな体格の32歳のJポップ風の男性がモダンなオフィスチェアに座っている。 彼は前髪のあるレイヤードショートヘアで、ダークグレーのスーツにダークネイビーのネクタイ、磨かれた黒の革靴を履いている。

■上のプロンプトによる生成画像

上のプロンプト1つですこれだけの画像が生み出されます。

プロンプト画像プロンプト画像プロンプト画像プロンプト画像プロンプト画像プロンプト画像

 

この情景のプロンプトは、下のブログ記事で使用したプロンプトです、数ヶ月前のプロンプトなので同じ画像は生成されていません。それでも、内容に合っていれば採用する方針にしていますので、今の記事ならどれかがブログに使用しているかもしれないですね。

quadro.hateblo.jp

 

GoogleInstagramTiktok、etc... 普段どんな方法で検索をしていますか?また、AIを活用した検索を使っていますか?

僕はずっとGoogle検索を使ってきましたが、AIをいろいろ試した結果、最後に知った「Perplexity(パープレキシティ)」を使うようになりました。

従来の検索エンジンは、気になる情報を深掘りしようとすると、再度キーワードを打ち直し、並んだリンクを一つずつ開いて確認する必要がありました。

正直、それが当たり前だと思って何年も同じ作業を続けていました。

ところが、Perplexityは質問を入力するだけで、自動的に複数のサイトを調べ、要点をまとめて答えてくれます。

参考にしたサイトのリンクも示してくれるので、「本当かな?」と思ったらすぐ自分で確認できます。ニュース、商品情報、技術的な解説まで幅広く対応しているのも便利です。

さらに、リアルタイムでネットを検索してくれるので、最新のニュースや価格が反映される点も大きいです。情報源が明確なので信頼性も判断しやすく安心できます。

使い続けて感じたのは、検索というより“会話しながら一緒に調べている”感覚に近いことです。途中で質問を変えても自然につながり、深掘りしすぎてもスクロールすればすぐ戻れる。

こうした気軽さが心地よく、今ではこればかり使っています。

以前はスマホの中央にGoogle検索が鎮座していましたが、今は隅に追いやられ、代わりにPerplexityが真ん中に落ち着いています。

ブログバトン──生成AIと過ごした一年の振り返り

ムッくんさん、バトンを託してくださり本当にありがとうございました。

体調が悪くて、他の方のブログは拝見していません、本来のブログバトンと違ってしまっていたらすみません。

頂いたお題に向き合いながら書き進めるうちに、この一年、自分がAIとどう向き合ってきたのかを静かに振り返る時間にもなりました。

いまは体調が優れず、次へきちんとお渡しすることが難しい状況ですが、まずは体を整えることを優先しようと思っています。

この一年を言葉にする機会をいただけたことに、心から感謝しています。

 

 




以上の内容はhttps://quadro.hateblo.jp/entry/kakonikki280より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14