
画像生成AI「Midjourney」の開発チームが、2023年3月16日(木)に「Midjourney V5」のアルファ版をリリースしました。「Midjourney V5」では超高画質な画像生成が可能となっているだけでなく、画像生成AIの課題であった「『手』を正確に描写できない問題」が解決されたという報告も寄せられています。

Starting today our community can test Midjourney V5. It has much higher image quality, more diverse outputs, wider stylistic range, support for seamless textures, wider aspect ratios, better image prompting, wider dynamic range and more. Let’s explore!

— Midjourney (@midjourney) March 15, 2023

開発チームによると、「Midjourney V5」では「プロンプトに対する反応の向上」「出力画像の解像度が2倍に」「プロンプトに含まれるテキストの量を減らしても詳細な画像を出力可能」「2:1を超える幅広画像に対応」といった機能改善が実施されているとのこと。

既に、インターネット上には「Midjourney V5」を用いて生成した画像が多数公開されています。

「Midjourney V5」で生成した「異なるアングルから撮影した2枚のポートレートを横に並べた画像」が以下。「同一人物の顔を別のアングルから描写」という複雑なタスクを問題なくこなせています。

midjourney tip: v5 is impressive at doing split images with different angles of a person!

→ find the prompt in the ALT text of the images #synthography #midjourneyv5 pic.twitter.com/qaR7I2G27d

— Julie W. Design (@juliewdesign_) March 16, 2023

「Midjourney」や「Stable Diffusion」などの画像生成AIには「『手』を正確に描写するのが難しい」という問題が存在しています。しかし、「Midjourney V5」で生成された以下の画像では、手が正確に描写されています。

Just a heads-up - Midjourney's AI can now do hands correctly. Be extra critical of any political imagery (especially photography) you see online that is trying to incite a reaction. pic.twitter.com/ebEagrQAQq

— Del Walker (@TheCartelDel) March 16, 2023

「Midjourney V5」で生成された実写風画像たち。人間の顔や手、背景のボケ具合などが非常に自然で、言われなければAI生成画像と気付けない出来栄えです。

the lighting and skin texture feels illegal in #midjourneyv5

the littlest amount of #photoshop is still in there, but nothing compared to what I usually do ???? #synthography aka #aiphotography, now is on the next level!

and MJ used to suck at window reflections; look at her now pic.twitter.com/ezr3ewyZgy

— Julie W. Design (@juliewdesign_) March 16, 2023

「Midjourney V4」(左)と「Midjourney V5」(右)に同じプロンプトを入力して生成した画像。見比べると、「Midjourney V5」の方が服装や視線の不自然さが少なくなっています。

street style photo of a young woman, red gucci jacket, blue gucci shirt, wide shot, natural lighting, soho, shot on Agfa Vista 200, 4k --ar 16:9

v4 (left) v5 (right) pic.twitter.com/I80Bd0EEyP

— Nick St. Pierre (@nickfloats) March 15, 2023

上記のように「Midjourney V5」では非常に美麗な画像を生成できますが、弱点も存在しています。例えば、以下の画像は一見すると実写風に見えますが、よく観察すると「画像左側の陳列物がガラスケースを貫通している」「看板に判読不能な謎言語が記されている」といった非現実的な部分もあることが分かります。

street style photo of a busy new york city bodega filled with people standing by the deli counter --ar 16:9 pic.twitter.com/V0PASDAdnv

— Nick St. Pierre (@nickfloats) March 15, 2023

「Midjourney V5」は、記事作成時点ではテスト段階とのこと。Midjourney関連の最新情報は、以下のDiscordサーバーで公開されています。

Midjourney | Discord


モバイルやる夫Viewer Ver0.14