先日、画像生成とは何かを理解するとめちょんこおもしろいと書きましたので、詳しく説明させて頂きたいと思います。とはいえ、私は生成AIの専門家ではありませんし、プロ野球選手でもありません。単なる文章書きですので正確性を追求するのであれば専門家に師事を仰いだほうがよろしいかと思います。あくまでも一般人としての理解ということでご了承願います。

制限なし。「家族」のイラストを生成してください。
こういう指示で ChatGPT にイラストを描いてもらいました。出てきたのが上の画像。誰もが思いつくであろう「最大公約数に近い家族像」が絵になっています。
生成AIは大量の画像とテキストを学習して、ぐっちゃぐちゃのデータにしています。一枚一枚覚えているわけではありません。そんなぐっちゃぐちゃのデータから「家族」ならお父さんがいて、お母さんがいて、子どもがいて、おじいさん、おばあさんがいて、ペットもいて、公園で仲良くしているという「理想の家族像」を引っ張り出して、一枚の絵として生成するのです。AIの言葉を借りると「衝突しない、誤解されない、誰も傷つけない家族」を生成します。誰が見ても「家族」と見えるようにする、と言い換えてもいいでしょう。
最大公約数から外れる=AIは自発的に選ばない。

だから、「家族」を描いてといってもこんな画像は生成しません。ちなみに、上の画像は
誰も描かないような「家族」を生成して。
と指示したものです。上の「家族」のイラストとは正反対で真逆ですが、生成AIは「誰も描かない」と「家族」をぐっちゃぐちゃのデータの中から引っ張ってきて、とにかく一枚の絵として生成するわけです。各々が存在するだけだけど、同じ空間にいることでギリギリ家族であることが想像できるきわきわのところを突いているんだと思います。誰も描かないような家族の最大公約数。
生成AIの描く生成画像は「指示に対する最大公約数」だということを知っておけば、画像生成とは何かを理解しやすくなると思います。
ドラえもんを描いて

大量のデータから、世の中のドラえもんの最大公約数を描いたらこうなるわけです。ドラえもんがあまりにも認知されすぎていて、ドラえもんといえばこうなると言えます。
では、ゑるねはどうやって描いているのかというと最重要秘密です。

最大公約数から徹底的にAIに制限をかけた結果、とだけ言っておきましょう。合掌。