ロンドンとカリフォルニアを拠点とするスタートアップ・Stability AIが、まるで人間のアーティストが描いたような高クオリティの画像を生み出せる画像生成AI「Stable Diffusion」を一般公開しました。モデルはCreative ML OpenRAIL-Mライセンスの下でリリースされており、商用での利用も許可されています。
Stable Diffusion Public Release — Stability.Ai
https://stability.ai/blog/stable-diffusion-public-release
CompVis/stable-diffusion · Hugging Face
https://huggingface.co/CompVis/stable-diffusion
Stable Diffusionの公開デモンストレーションには以下のページでアクセスできます。
Stable Diffusion - a Hugging Face Space by stabilityai
https://huggingface.co/spaces/stabilityai/stable-diffusion
使い方は非常に簡単で、Stable Diffusionに描画してほしいイメージを英語で入力して「Generate image」をクリックするだけ。今回は「girl with baloons on the beach」というキーワードを入力。
生成に数十秒待ちます。
「ビーチで風船を持つ女の子」を描いた3枚の絵が出力されました。出力される画像のサイズは512×512ピクセルです。
1枚目は非常にセクシーですが、女の子の顔がいかつく、こちらをにらみつけるような表情となっています。
2枚目はもっと幼い女の子が浜辺を歩いている様子。
3枚目は流される風船を浜辺で見つめる女の子という画像でした。
入力するキーワードは英語である必要がありますが、入力してから生成までの時間はかなり短く、画像としても精度は高めです。そこで、いろいろ入力してStable Diffusionに画像を生成してもらいました。
「A pikachu fine dining with a view to the Eiffel Tower」
「A mecha robot in a favela in expressionist style」
「Hiroshi Abe eat big soft cream in london」は、俳優の阿部寛氏を想定していたのですが、まったく知らないおじさんが登場。
「Spider man fight a dog in Akihabara」
なお、Stable Diffusionは記事作成時点でNVIDIAチップでの動作が推奨されていますが、AMDやApple M1/M2、およびその他のチップセットでの動作にも最適化するようアップデートを予定しているとのこと。また、パフォーマンスと品質が向上したバリアントおよびアーキテクチャも将来的にリリースされるそうです。
・つづき
画像生成AI「Stable Diffusion」を低スペックPCでも無料かつ待ち時間なしで使う方法まとめ - GIGAZINE