無料画像生成AIの限界と可能性
無料画像生成AIで「同じ顔」を作る難しさ
また、懲りずに画像をリファレンスとして再利用生成テストをやっています。
過去日記作成中で、完成するまでの間、このような簡単な記事ばかりで申し訳ありません、飽きずにお付き合いください。
今回も、生成AIを使って、いろいろなプロンプトで画像の修正を試してみました。
使ったのは ImageFX、Gemini、Copilot、ChatGPT の4つ、それぞれ同じテーマ、同じ構図、同じトーンを意識して出力してみました。
🖼 ImageFXでの出力例
過去日記初期の頃、ImageFXでゼロからプロンプトで生成したマユミの元画像、この画像をベースにリファレンスとして再利用。
ImageFXは光の表現が自然で、肌のトーンも比較的柔らかく出てくれます。
ただ、同じプロンプトでも微妙に顔の輪郭や目元が変わってしまうのが難点。
毎回“別人のような同じ人”が生まれてしまうのです。
🖼 Geminiでの出力例
Geminiで生成したマユミ、Google系なので、プロンプトも近い感じで修正が行なわれる。他社より精細感が弱い。
Geminiは構図の安定感がありますが、人物の印象が少し硬くなりがち。
自然光や背景のトーンを整えるのは得意ですが、やはり「顔の再現性」はまだ課題が残ります。
🖼 Copilotでの出力例
Copilotで生成したマユミ、思ったより自然な感じでしたが、補正する前は立体的過ぎてCGのようでした。
Copilotはディテールが緻密で、ファッションの質感などがリアルに仕上がります。
けれど、やはり毎回少しずつ顔が変化してしまう。
まるで双子のように似ているけれど、よく見ると別人──そんな感覚です。
🖼 ChatGPTでの出力例
ChatGPTで生成したマユミ、見た目は同じにできましたが、顔のパーツは違った感じで別人のようになります。
ChatGPTは表情の自然さが魅力。
ただ、プロンプトだけで同一人物を再現しようとすると、他と同じく安定しません。画像のリファレンス生成でも、再現性は雰囲気だけは近いのですが再利用出来ません。
光、服装、角度を揃えても、少しずつ印象が変わってしまうのです。
ChatGPTで最初に出力したのがこの画像。まったく似てなくて別人みたいなのでやり直しました。ChatGPTは少し地味目のアジア人がお好みみたいです。同じプロンプトでこれだけ差が出るなんて!
顔の固定が難しい理由
無料の画像生成AIは、同じ顔を維持する機能がまだ十分ではありません。
商用版や有料モデルでは「Face ID」や「Character Reference」などで顔の一貫性を保てるものもありますが、無料の範囲ではランダム性が強く、安定化が難しいのが現状です。
テスト生成された画像は、人によって好みが分かれるかもしれません。
当事者としては、Gemini版が一番しっくりきましたが、ChatGPT版も嫌いではありません。
しかし、他の生成AIは実績が少なく、コンスタントに出せるかは未知数なのでテスト次第で考えるかもしれません。
むしろ、別の物語で“別人として登場させる”のも面白いかもしれません。
どれが良いかは人それぞれの感性によるところで、どのAIもそれぞれの味があります。
それでも、いくつかの工夫で“似せる”ことは可能です。
- プロンプトに「same person」「consistent face」「previous portrait」などを加える
- 顔の特徴(髪型・目の形・輪郭)を具体的に記述する、書き方に工夫がいる
- 一度気に入った画像をリファレンスとして再利用する
これらを組み合わせることで、少しずつ「同じ人らしさ」に近づけます。
参考図書
画像生成AIアプリでイラスト化
おまけに画像から別の生成AIアプリでイラストに変換してみました。簡単なプロンプトなのでそこまで突き詰めていません。
最初はマユミ本人の顔バレを恐れてイラストでやっていたのです。
しかし、安定感がなく結局やめてしまいました。写真画像にして、完璧に似ることはなかったので、写真画像を過去日記にすることにして今に至っています。
マユミの画像からイラストに生成した画像。
おわりに
画像生成AIはまだ発展途中ですが、「毎回少し違う顔が生まれる」こともまた、創作の面白さかもしれません。
ほんのわずかな違いに“その人の表情の幅”を感じると、AIでさえも人間らしい揺らぎを見せているように思えます。


