以下の内容はhttps://quadro.hateblo.jp/entry/kakonikki241より取得しました。


画像生成AIを比べてみた話 、その2―再構成稿――「同じ顔で物語をつなぐために」 ImageFX・Gemini・ChatGPT-4・Copilot

再構成稿――「同じ顔で物語をつなぐために」

1. 問題意識:登場人物が“人”に見える違和感

画像付きのストーリー制作で、登場人物の顔や雰囲気が突然変わるのは致命的です。実写のドラマなら、降板やキャスト変更は放送前に告知されるのが当然。視聴者の混乱を避けるための最低限の配慮です。ボクもブログで物語を描く以上、本心では同じ見た目の登場人物で統一したいと考えています。

 

2. 現実との折り合い:無料アプリの限界

とはいえ、無料の生成AIアプリでは「同じ顔」を安定して再現する機能に限界があります。理想に届くまで粘れば、公開が何日も遅れる。内容の規模に対して時間をかけすぎるのは本末転倒だと割り切り、歯がゆさを抱えつつも公開を優先する場面が多いのが現状です。

3. 他者事例への敬意:完成度と制作姿勢

他の方のブログには、整然とした表やグラフ、イラストを駆使し、内容も見た目も90点以上に仕上げてから公開している例があり、純粋に感心します。おそらく、プレゼン資料を作り慣れた方が、そのスキルをブログに活かしているのでしょう。ボク自身、専門書のデザインに携わってきたこともあり、その完成度には憧れを覚えます。

4. 出発点の制約:スマホ運用の選択

ボクがブログを始めたきっかけはスマホだけで完結させる」こと。結果として、長い時間をスマホ中心の運用に費やしてきました。正直、スマホだけでは難しい作業も多い。もし時間を戻せるなら、PC環境に移行し、有料の生成AIを導入して、プロンプトを細かく積み上げ、アングルや時間、向きまで絵コンテ通りに統制したい――そう思うことがあります。

5. 理想像:映画的ワークフローへの憧れ

理想は、映画監督のような制作体制です。こだわったアングル、用意したセット、シーンに合った照明。会社も家も“舞台”として再現し、登場人物を意図した配置で“芝居”してもらう。登場人物の数を増やし、画面内の関係性を緻密に設計できれば、ボツにした話も再構成でき、モチベーションはさらに高まるはずです。

6. 現在の対策:同一人物再現のための継続テスト

現実的な打ち手として、ボクはテストを重ねています。無料アプリの制約がある前提で、「同じ登場人物が突然別人に見えない」ラインを見極めるために、条件を変えつつ反復検証。プロンプトの言い回し、参照画像の使い方、生成条件の固定・変数の切り分け――こうした工夫を積み上げ、モチベーションの消耗を最小化するのが狙いです。

 

7. 進行中の検証:複数AI間での再現性チェック

今回も、同じ人物像を複数の生成AIアプリでどこまで同じように出せるか、その“目安”を測っています。モデルごとの癖や得意・不得意を把握し、再現率の高い設定をテンプレート化する。公開を遅らせすぎない現実解を探る、継続的な取り組みです。

8. 結び:理想と現実のバランス

理想は高く、現実は厳しい。だからこそ、いまは“壊れない最低限の統一感”を確保しつつ、制作速度を落としすぎないバランスを取る。長期的には環境を整え、再現性の精度を上げていく。――その方針で、ボクはこれからも物語と画像の一体感にこだわっていきます。

 

9.今回のテスト

元画像(生成された画像の中でもお気に入りの画像)を生成AIアプリに読み込ませ、プロンプトで変更を加えてみました。今回はごく簡単な変更でしたが、一部は意図通り(雰囲気を壊さず)に動いてくれた印象です。完成度としては“40点”といったところでしょう。

同じGoogle系の Gemini は、見た目を変えずに登場人物が自分なりに芝居をしているような仕上がりになりました。これは一定の評価ができます。

一方で、別の生成AIでは、プロンプトをそのまま解釈したのか、証明写真のような画しか出てきませんでした。正直、お芝居に使えるようなものではなく、使い道は「証明写真」としてだけです。強いて活用するなら、フォトショップなどで加工し、免許証のようなカードに変形させてハメ込み画像として使う程度でしょう。これはどうしても パソコンとマウスでの作業 が必要になります。

ただし、ChatGPTやCopilotに写真を読み込ませた場合は雰囲気を壊すことはありませんでした。プロンプト次第では、より自然に「芝居をしている」ような画像を作れる可能性もあります。つまり、この二つの生成AIは、プロンプトから直に生成するよりは、工夫次第で元画像と同じ画像を生成して、十分にお芝居用の画像を生み出せるかもしれません。

 

プロンプト指示文

この顔をのパーツと髪型を変えずに、正面を向かせてください。

アスペクト比3:4でお願いします。

高精細、高解像度リアル写真。

元画像(ImageFX)

ImageFXマユミ

Gemini

Geminiマユミ

ChatGPT

ChatGPT-4

Copilot

Copilotマユミ

10.関連記事

quadro.hateblo.jp

quadro.hateblo.jp

quadro.hateblo.jp

quadro.hateblo.jp

quadro.hateblo.jp

quadro.hateblo.jp

quadro.hateblo.jp

quadro.hateblo.jp

quadro.hateblo.jp

quadro.hateblo.jp

quadro.hateblo.jp

quadro.hateblo.jp

quadro.hateblo.jp

quadro.hateblo.jp

 

 

 




以上の内容はhttps://quadro.hateblo.jp/entry/kakonikki241より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14