実験
プロンプト
写真の男性が500mlのペットボトルに入ったスポーツドリンクを飲んでいるクローズアップされた写真を作って スポーツドリンクの宣伝用なので商品名が写るように作って
before

↓
after AI加工後 所要時間3分

ポーズを変えても顔をAIが覚えていて修正。
新規の画像生成はできても、顔などの一貫性を保ちながらAIが画像修正することは苦手
(一部対応しているAIもあったけど、色合いやディテールなどは微妙・・・)
これは今までなら、専門業者に頼んで加工してもらったような写真も一般人が
「プロンプト一つで、プロフェッショナルな写真加工ができるようになった」
ことを意味する
ここではやらないけど写真から動画も作成できる。google vids使えば簡単に自分でCM動画も作れる
これが無料?Googleが新しく公開したNano Bananaが革命的だった!
これも含めて全体的に1,2年でAIを使いこなす組織と否定的になってAIを拒絶し続ける組織の間で、天と地ほどの差が出ると予想。。。。(AIを使える人と使えない人でも同様)

第1章:「Nano Bananas」革命:Googleがあなたの想像力をアップグレード
AI愛好家たちの間で、その驚異的な写真編集能力によって話題をさらった謎のモデル「nano bananas」の噂が、テクノロジーコミュニティを駆け巡りました 1。このモデルは、LMArenaのような公開AIテストサイトに匿名で登場し、誰が開発したのか知られる前に、その卓越した性能で注目を集めました。そして2025年8月26日、Googleはこのモデルが
Gemini 2.5 Flash Imageという、同社のネイティブ画像生成・編集ツールへのメジャーアップグレードであることを正式に発表しました 4。これは単なる新しい画像生成ツールではありません。複雑な編集を、まるで会話をするかのように簡単に行えるようにする、クリエイティブAIとの関わり方における根本的な変化を意味します。
このアップデートの位置づけを理解するためには、GoogleのAIブランド間の関係を整理することが重要です。Imagenは、Google DeepMindが開発した強力なテキストから画像への変換モデル群の総称であり、Imagen 4はその最新世代として2025年5月20日のGoogle I/Oで発表されました 10。一方で、
Gemini 2.5 Flash Imageは、このImagenの強力なエンジンを搭載し、Geminiエコシステム内で速度、編集、そして対話的な操作に最適化された、ユーザー向けの具体的な実装です 2。つまり、Geminiがユーザーのクリエイティブなパートナーとして機能し、その頭脳としてImagenが働いているのです。
Googleが「nano bananas」を公に匿名でリリースしたことは、単なる偶然ではありませんでした。これは、製品開発とマーケティングを兼ねた、計算された戦略です。公開リーダーボードで競合製品とリアルタイムで性能を比較し、公平なユーザーフィードバックを収集することで、公式発表前に製品の品質を客観的に証明しました 1。この手法は、AIコミュニティ内で自然発生的な好奇心と期待感を醸成し、Googleの幹部による謎めいたヒントがその憶測をさらに加速させました 1。これは、専門家が多く存在する市場において、製品の信頼性を構築し、期待感を最大化するための洗練されたアプローチと言えるでしょう。
第2章:画期的な新機能の詳細解説
今回のアップデートがもたらした変革は、単なる品質向上にとどまりません。クリエイティブなプロセスそのものを再定義する、いくつかの核心的な機能が含まれています。
対話型編集:写真と文字通り「会話」する
最も大きな変化は、ユーザーが自然言語のプロンプトを複数回にわたって入力することで、対話形式で画像を編集できるようになった点です。これは「マルチターン」プロセスと呼ばれ、AIが直前の編集の文脈を記憶しているため、段階的な修正が可能になります 5。
例えば、以下のようなワークフローが実現します。
- リビングルームの写真をアップロードする。
- プロンプト:「壁をライトブルーに塗って」
- フォローアッププロンプト:「次に、左の壁に大きな本棚を追加して」
- 最後のプロンプト:「隅にゴムの木を置いて」
このように、一度の完璧なプロンプトを考える必要はなく、アイデアを少しずつ形にしていくことができます 5。さらに、背景をぼかす、服のシミを消す、白黒写真に色を付ける、被写体のポーズを変えるといった、より具体的な指示もテキストだけで実行可能です 6。
キャラクターの一貫性:ついにAIが顔を覚えた
従来の画像生成AIにおける最大の課題の一つは、同じキャラクターを異なるシーンで一貫して描写できないことでした。しかし、Gemini 2.5 Flash Imageは、人物、ペット、オブジェクトの見た目を複数の画像にわたって維持する能力が大幅に向上しています 5。
これにより、「(参照画像を提示して)この人物がエッフェル塔の前に立っている写真」を生成した後、「同じ人物がパリのカフェでコーヒーを飲んでいる画像」を作成する、といったことが可能になります。モデルは顔の特徴や髪型などを維持するため、ストーリーテリングやマーケティング、一貫したブランドアセットの作成において、これはまさにゲームチェンジャーです 5。この機能により、ユーザーは特定のデータでモデルをファインチューニングするという、時間とコストのかかるプロセスから解放されます 13。
マルチイメージフュージョン:究極のクリエイティブブレンダー
複数の写真をアップロードし、それらを一つのまとまりのある新しいシーンに融合させる機能も搭載されました。これは単なるコラージュではなく、AIが各画像の意味内容を理解した上でブレンドする、より高度な技術です 5。
例えば、「私自身の写真と私の犬の写真を使い、私たちがバスケットボールコートで一緒に遊んでいる新しい画像を作成して」といった、異なる要素を組み合わせたシーンの生成が可能です 5。また、「デザインリミックス」と呼ばれる応用的な使い方として、「レインブーツの画像とピンクのバラの画像をアップロードし、バラにインスパイアされた花柄のレインブーツを再創造して」という指示も可能です 1。これは、モデルがスタイルやテクスチャを抽出して適用する能力を持っていることを示しています。
基本性能の向上:リアリズム、ディテール、そしてテキスト
これらの革新的な編集機能の基盤となる、Imagen 4エンジンの画像生成品質そのものも大幅に向上しています。生成される画像はより高品質でディテールが豊かになり、布地、水滴、動物の毛皮といった微細な質感の表現力が格段に向上しました 12。
特に注目すべきは、「スペルとタイポグラフィの改善」です。これまでほとんどの画像生成AIが苦手としてきた、画像内のテキストを正確に描写する能力が向上したことで、ポスターや招待状、マーケティング資料など、意味のあるテキストを含むビジュアルを直接作成するという新しい用途が開かれました 15。
これらの機能を総合すると、AIとの関係性が根本的に変化していることがわかります。もはやAIは、一度きりの命令で画像を生成する「ジェネレーター」ではなく、自然な対話を通じてアイデアを共に練り上げる「クリエイティブ・コラボレーター」へと進化しているのです。これにより、専門家でなくとも直感的で流動的なクリエイティブプロセスが可能になり、創造性のハードルが大きく下がりました。ユーザーの役割は、完璧な呪文を唱える「プロンプトエンジニア」から、AIというアシスタントを導く「クリエイティブディレクター」へと変わっていくでしょう。
第3章:競合比較:Gemini vs. Midjourney vs. DALL-E 3
Geminiのアップデートは非常に強力ですが、MidjourneyやOpenAIのDALL-E 3といった優れたツールがひしめく競争の激しい市場に存在します 19。ここでは、「どれが一番か」ではなく、「あなたにとってどれが最適か」という視点で、各ツールの哲学と強みを比較します。
主要なAI画像生成ツールの機能比較(2025年)
以下の表は、各プラットフォームの主要な特徴をまとめたものです。
|
機能 |
Gemini 2.5 Flash Image |
Midjourney V7 |
DALL-E 3 (in ChatGPT) |
|
アクセス方法 |
Geminiアプリ、Web、API、Vertex AI、Adobe、Figma |
Webアプリ、Discord |
ChatGPTアプリ、Web、API |
|
中核的な強み |
対話型編集とエコシステム統合 |
芸術的な品質とスタイル制御 |
プロンプトへの忠実性と使いやすさ |
|
キャラクターの一貫性 |
あり(強力、標準機能) |
あり(「Omni-Reference」機能で非常に優れる) |
限定的/信頼性が低い |
|
画像内編集 |
あり(高度な対話型インペインティング/アウトペインティング) |
あり(Vary Region、Pan、Zoom) |
あり(エディターインターフェースによるインペインティング) |
|
使いやすさ |
非常に高い(自然言語チャット) |
中程度(パラメータやDiscordコマンドの学習が必要) |
非常に高い(ChatGPTに統合) |
|
価格(エントリー) |
無料プランあり |
有料のみ(月額10ドルから) |
ChatGPTで無料(制限あり)、Plus(月額20ドル)に含まれる |
|
最適な用途 |
反復的なデザイン、素早い編集、マーケティング素材、初心者 |
プロのアーティスト、コンセプトアート、独自のスタイル表現 |
ブレインストーミング、イラスト、直接的なプロンプトからの画像生成 |
|
主な弱点 |
画像を「磨きすぎ」て質感を失うことがある 24 |
学習曲線が急で、編集が直感的でない |
芸術的な「味」が少なく、キャラクターの一貫性が課題 |
詳細な分析
- Geminiのニッチ:クリエイティブ・アシスタント
Geminiの強みは、Googleエコシステムとの深い統合と、対話を通じた反復的な編集プロセスにあります。アイデアを元に、AIと協力しながら少しずつ完成度を高めていきたいユーザーに最適です 2。 - Midjourneyのニッチ:アーティストのキャンバス
Midjourneyは、しばしば映画のような、息をのむほど美しい画像を生成し、アーティストにスタイルを細かく制御する手段を提供します。特に「Omni-Reference」機能は、Geminiのキャラクター一貫性機能の強力なライバルです 25。 - DALL-E 3のニッチ:インスタント・イラストレーター
DALL-E 3の真価は、複雑で具体的なプロンプトを非常に正確に理解する能力にあります。説明した通りのものを一度で手に入れたい場合に最も優れたツールです 28。
第4章:始め方:プラン、価格、利用可能な場所
このセクションでは、「この素晴らしいツールをどうすれば試せるのか、費用はいくらかかるのか」という、ユーザーの具体的な疑問に答えます。
一般クリエイターとホビイスト向け(Geminiアプリ)
最も重要な点は、今回発表された画像生成と編集の中核機能が、無料プランを含むすべてのGeminiユーザーに提供されることです 1。これは、多くの人々にとって非常にアクセスしやすいものとなっています。有料プランにアップグレードすることで、さらに高度な機能を利用できます。
Google AI サブスクリプションプランと機能
|
プラン |
月額料金 |
主な画像・動画機能 |
対象ユーザー |
|
Gemini (無料) |
0ドル |
Gemini 2.5 Flash Image(新しい編集、一貫性、融合機能)、Imagen 4による画像生成 |
全員、カジュアルユーザー、ホビイスト |
|
Google AI Pro |
19.99ドル |
無料プランの全機能 + Veo 3 Fastによる動画生成、利用上限の緩和 |
プロシューマー、コンテンツクリエイター、小規模ビジネス |
|
Google AI Ultra |
249.99ドル |
Proプランの全機能 + Veo 3(最先端動画モデル)への最高レベルのアクセス、高度な推論モデル |
パワーユーザー、プロのクリエイター、制作会社 |
クリエイティブプロフェッショナル向け(Adobe、Figmaなど)
Googleは、プロフェッショナルが日常的に使用しているツール内にGemini 2.5 Flash Imageを組み込む戦略をとっています。これにより、既存のワークフローを離れることなく、最新のAI機能を利用できます。具体的には、Adobe Firefly、Adobe Express、Figmaといった主要なクリエイティブプラットフォームへの統合が発表されています 1。Adobeの幹部は、この統合がクリエイティブなワークフローに大きな価値をもたらすと述べています 13。
開発者と企業向け(API)
企業や開発者は、この技術を基盤として独自のアプリケーションを構築することも可能です。Gemini API、Google AI Studio、Vertex AIを通じてモデルにアクセスできます 6。開発者向けの価格設定は明確で、100万出力トークンあたり30.00ドル、これは
画像1枚あたり約0.039ドルに相当します 6。
このアクセスと価格の構造は、GoogleのAI市場における三層戦略を明らかにしています。第一層(消費者向け)では、無料提供による大規模な普及とユーザーデータの収集を目指します。第二層(プロフェッショナル向け)では、既存のエコシステムに統合されることで、クリエイティブ業界の不可欠な「エンジン」となることを狙います。第三層(企業向け)では、APIを通じた従量課金制で直接的な収益化を図ります。これら三つの層が連携し、市場のあらゆるレベルでGoogleのAI技術を浸透させる、包括的な計画がうかがえます。
第5章:実践的な応用例:マーケティングから個人的な傑作まで
この技術がどのように実世界で活用できるのか、具体的な例を通じて紹介します。
マーケティングとブランディングの革新
一度も写真撮影を行うことなく、一貫したブランドマスコットやモデルが登場する広告キャンペーンを、何十もの異なるシーンで展開することが可能になります。大手広告代理店WPPの幹部は、この能力が特に小売業や消費財メーカーにとって強力なツールになると評価しています 13。また、マルチイメージフュージョンを使えば、新製品を様々なライフスタイルシーンに配置したSNS投稿用の画像を簡単に作成できます。これは、CoronaやTwangといったブランドが同様のAIワークフローで実践している手法です 35。
プロダクトデザインとグラフィックデザインの加速
プロダクトデザイナーは、新しいスニーカーのモックアップを生成し、その後、対話型編集機能を使って「ソールの色をガムラバーに変えて」「靴紐をネオングリーンにして」といった指示を出すだけで、何十ものカラーバリエーションや素材の質感を即座に試すことができます。改善されたタイポグラフィ機能は、ウェブサイトのバナーやロゴ、SNS用のグラフィックを高忠実度で直接作成するのに役立ちます 15。特にFigmaとの統合は、デザイナーのワークフローを大幅に効率化するでしょう 13。
個人の創造性の解放
自分自身の子供やペットを主人公にした、パーソナライズされた絵本を作成し、すべてのページでその姿を維持することができます。また、以下のようなクリエイティブなプロジェクトのアイデアも考えられます。
- 「私のビンテージカーの写真とサイバーパンクな街の写真を融合させて、レトロフューチャーなポスターを作って」
- 「私が描いたこのスケッチを写実的な画像に変換し、ドラマチックな夕焼けの照明を加えて」
- 「私の犬を、フィルム・ノワールの探偵、冒険好きな海賊、宇宙探検家といった、さまざまな映画ジャンルのキャラクターとして描いたシリーズ画像を作って」 36
第6章:創造性の未来は「対話」にある
今回のアップデートの核心は、真の対話型編集、信頼性の高いキャラクターの一貫性、そしてシームレスなマルチイメージフュージョンという三つの革命的な柱に集約されます。
この変化が意味するものは、単なる機能追加以上のものです。これは、高度な創造力を誰もが利用できるようにするための、重要なマイルストーンです。デジタルクリエーションの未来は、複雑なソフトウェアを習得することではなく、強力なAIコラボレーターとの対話を通じて、自らの想像力を明確に表現することにかかっています。
未来を理解する最善の方法は、それを自分で試してみることです。Geminiアプリを開き、写真を一枚アップロードして、対話を始めてみてください。きっと、あなたが生み出せるものに驚くはずです 38。
引用文献
- Google's New AI Image Model 'Bananas' Is Here: How to Edit Your ..., 8月 28, 2025にアクセス、 https://www.cnet.com/tech/services-and-software/googles-new-ai-image-model-bananas-is-here-how-to-edit-your-photos-with-gemini/
- Google updates Gemini, adding powerful new AI image model with photo editing capabilities - SiliconANGLE, 8月 28, 2025にアクセス、 https://siliconangle.com/2025/08/26/google-updates-gemini-powerful-new-ai-image-model-photo-editing-capabilities/
- 【速報】Googleからすごい画像生成AI Gemini 2.5(nano-banana)がリリース - note, 8月 28, 2025にアクセス、 https://note.com/hitsuji_fire/n/n47adb9517812
- Release notes | Gemini API | Google AI for Developers, 8月 28, 2025にアクセス、 https://ai.google.dev/gemini-api/docs/changelog
- Google announces native image editing in Gemini app - The Keyword, 8月 28, 2025にアクセス、 https://blog.google/products/gemini/updated-image-editing-model/
- Introducing Gemini 2.5 Flash Image, our state-of-the-art image ..., 8月 28, 2025にアクセス、 https://developers.googleblog.com/en/introducing-gemini-2-5-flash-image/
- Nano banana is here: Google unveils Gemini 2.5 Flash Image upgrade, 8月 28, 2025にアクセス、 https://economictimes.indiatimes.com/tech/artificial-intelligence/nano-banana-is-here-google-unveils-gemini-2-5-flash-image-upgrade/articleshow/123529187.cms
- Google Updates AI Image Generation, Adds Loyalty Program Option for Retailers, 8月 28, 2025にアクセス、 https://www.socialmediatoday.com/news/google-updates-ai-image-generation-adds-loyalty-program-retailers/758691/
- Tips for getting the best image generation and editing in the Gemini app - The Keyword, 8月 28, 2025にアクセス、 https://blog.google/products/gemini/image-generation-prompting-tips/
- en.wikipedia.org, 8月 28, 2025にアクセス、 https://en.wikipedia.org/wiki/Imagen_(text-to-image_model)#:~:text=Imagen%203%20was%20released%20in,an%20improved%20model%2C%20Imagen%204.
- Imagen (text-to-image model) - Wikipedia, 8月 28, 2025にアクセス、 https://en.wikipedia.org/wiki/Imagen_(text-to-image_model)
- Fuel your creativity with new generative media models and tools - The Keyword, 8月 28, 2025にアクセス、 https://blog.google/technology/ai/generative-media-models-io-2025/
- Gemini 2.5 Flash Image on Vertex AI | Google Cloud Blog, 8月 28, 2025にアクセス、 https://cloud.google.com/blog/products/ai-machine-learning/gemini-2-5-flash-image-on-vertex-ai
- Gemini を使用した画像生成 | Gemini API | Google AI for Developers, 8月 28, 2025にアクセス、 https://ai.google.dev/gemini-api/docs/image-generation?hl=ja
- Gemini Apps' release updates & improvements - Google Gemini, 8月 28, 2025にアクセス、 https://gemini.google/release-notes/
- Imagen - Google DeepMind, 8月 28, 2025にアクセス、 https://deepmind.google/models/imagen/
- 新しい動画生成モデル「Google Veo」と画像生成モデル「Imagen 3」を Vertex AI で提供開始, 8月 28, 2025にアクセス、 https://cloud.google.com/blog/ja/products/ai-machine-learning/introducing-veo-and-imagen-3-on-vertex-ai
- Googleの新たな画像・動画生成モデル「Imagen 3」と「Veo」を徹底解説 - 株式会社Nuco, 8月 28, 2025にアクセス、 https://nuco.co.jp/blog/article/jtvCSKsU
- I compared the 6 best AI image generators of 2025 (updated) | Mashable, 8月 28, 2025にアクセス、 https://mashable.com/article/best-ai-image-generator-1
- The 8 best AI image generators in 2025 - Zapier, 8月 28, 2025にアクセス、 https://zapier.com/blog/best-ai-image-generator/
- Best AI Image Generators of 2025 - CNET, 8月 28, 2025にアクセス、 https://www.cnet.com/tech/services-and-software/best-ai-image-generators/
- 【2025最新・無料】おすすめの生成AIツール20選!各ツールの特徴や選び方のポイントも解説, 8月 28, 2025にアクセス、 https://shift-ai.co.jp/blog/3388/
- 【無料あり】画像生成AIのおすすめツールまとめ7選!2025年最新版 - WEEL, 8月 28, 2025にアクセス、 https://weel.co.jp/media/innovator/bard-bingai-imagegeneration/
- Google Gemini 2.5 Flash Image, Nano Banana released : Bye Bye Photoshop | by Mehul Gupta | Data Science in Your Pocket | Aug, 2025 | Medium, 8月 28, 2025にアクセス、 https://medium.com/data-science-in-your-pocket/google-gemini-2-5-flash-image-nano-banana-released-bye-bye-photoshop-72383e91e0fd
- Simple Steps for Consistent Characters in Midjourney V7 Using Omni-Reference, 8月 28, 2025にアクセス、 https://www.titanxt.io/post/simple-steps-for-consistent-characters-in-midjourney-v7-using-omnireference
- Character Reference - Midjourney, 8月 28, 2025にアクセス、 https://docs.midjourney.com/hc/en-us/articles/32162917505293-Character-Reference
- I Tested Midjourney vs. DALL·E to Find the Best AI Image Generator - G2 Learning Hub, 8月 28, 2025にアクセス、 https://learn.g2.com/midjourney-vs-dall-e
- Editing your images with ChatGPT Images | OpenAI Help Center, 8月 28, 2025にアクセス、 https://help.openai.com/en/articles/9055440-editing-your-images-with-chatgpt-images
- How To Use Dall-E 3 And Edit Images (Tutorial) - YouTube, 8月 28, 2025にアクセス、 https://www.youtube.com/watch?v=hlHpMm89gQ0
- DALLE3 Inpainting: Editing your images with DALL·E - OpenAI Developer Community, 8月 28, 2025にアクセス、 https://community.openai.com/t/dalle3-inpainting-editing-your-images-with-dall-e/705477
- Dall-E 3 vs Midjourney: A Side-by-Side AI Image Comparison - Writesonic, 8月 28, 2025にアクセス、 https://writesonic.com/blog/dall-e-3-vs-midjourney
- アドビ「Firefly」、Googleの最新画像生成AI「Gemini 2.5 Flash Image」に対応 Adobe Expressでも使える - ITmedia, 8月 28, 2025にアクセス、 https://www.itmedia.co.jp/aiplus/articles/2508/27/news122.html
- Google Gemini 2.5 Flash Image (Nano Bananas) is quite good - The Register, 8月 28, 2025にアクセス、 https://www.theregister.com/2025/08/26/google_gemini_ai_images/
- Vertex AI release notes | Google Cloud, 8月 28, 2025にアクセス、 https://cloud.google.com/vertex-ai/docs/release-notes
- 5 Examples of Brands Using Generative AI to Elevate Their Creative Capabilities, 8月 28, 2025にアクセス、 https://blog.shuttlerock.com/5-examples-of-brands-using-generative-ai-to-elevate-their-creative-capabilities
- 10 Mind-Blowing AI Illustration Prompts to Spark Your Next Project - iCreatives, 8月 28, 2025にアクセス、 https://www.icreatives.com/iblog/10-mind-blowing-ai-illustration-prompts-to-spark-your-next-project/
- 25 Best AI Art Prompts for Image Generation (With Examples) - ClickUp, 8月 28, 2025にアクセス、 https://clickup.com/blog/ai-art-prompts/
- Gemini アプリで画像を生成、編集する - Android, 8月 28, 2025にアクセス、 https://support.google.com/gemini/answer/14286560?hl=ja&co=GENIE.Platform%3DAndroid
- 無料で使えるGeminiの画像生成がすごい!3つの特徴や使用方法を解説! - 株式会社SHIFT AI, 8月 28, 2025にアクセス、 https://shift-ai.co.jp/blog/22832/