| |

服の平置き画像からAIモデルの着用画像へ:Nano Banana Proで実現する5ステップワークフロー(2026年実測)

手元に服の平置き画像やハンガーショットしかないのに、モデル着用画像が必要になる——これはアパレルEC運営において最も頻繁に発生するニーズです。モデル代、カメラマン、スタジオ代、レタッチ費用を合わせると、リアルな撮影は一度で数千ドルに達し、期間も1〜2週間かかります。SHEINのようなファストファッション大手に至っては、年間の撮影費用は数億ドル規模です。本記事では、Nano Banana Pro を活用した「平置き画像から着用画像への変換」5ステップワークフローを紹介します。画像から画像生成(i2i)の能力を駆使して、平置き画像をそのままECサイトに掲載できるAIモデル画像に変える方法を解説します。

核心的価値: 本記事を読み終える頃には、平置き画像から着用画像への完全なAPIワークフロー、服のディテールを忠実に再現するプロンプトの書き方、そして型崩れや色味のズレといったよくある失敗の修正方法をマスターできます。1枚あたりの生成コストは0.1ドルレベルに抑えることが可能です。

nano-banana-pro-flat-lay-to-model-photo-apparel-workflow-ja 图示

平置き画像から着用画像への変換の核心:Nano Banana Pro 能力解析

Nano Banana Proは、Google DeepMindが発表したGemini 3 Pro Imageモデルのコミュニティ内での愛称です。2025年11月のリリース後、アパレル分野の画像生成において瞬く間に第一選択肢となりました。平面的な服の画像をAI生成されたモデルに「着せる」ことができ、同時に生地の質感、プリント柄、自然な光と影を維持できるため、平置き画像から着用画像への変換に最も適した能力を備えています。

核心能力 説明 アパレルシーンでの価値
マルチ画像入力 1回につき最大14枚の参照画像に対応 平置き画像+モデル参照+背景画像を同時入力可能
ディテール保全 柄やロゴを3D表面に自然にフィットさせ、光影を維持 プリント、刺繍、ボタンを崩さない
解像度設定 1K / 2K / 4Kの3段階出力 詳細ページには2K、メイン画像拡大用には4K
多ラウンド一貫性 多ラウンド対話編集をサポートし、人物像を安定維持 同一モデルで正面、側面など多角度の画像を生成
比率制御 aspectRatioパラメータでアスペクト比を指定 ECサイトの3:4、1:1などのメイン画像規格に適合

Nano Banana Pro 服装生成のコスト計算

コストは、アパレル事業者がリアル撮影からAI生成へ移行する最大の動機です。海外コミュニティの実測データによると、従来の撮影の総合コストは3,500ドル以上で期間も1〜2週間かかりますが、AIで50枚以上のバリエーション画像を生成する場合、費用はわずか10〜35ドルで、数分以内に完了します。

比較項目 リアルモデル撮影 Nano Banana Pro 生成
1回あたりの総合コスト $3,500〜 $10-35(50枚のバリエーション)
1枚あたりのコスト 均等割で約$50-100 約$0.05-0.134(解像度による)
納期 1-2週間 数分
改変・再撮影 モデルとスタジオの再予約が必要 プロンプト修正で再生成
多市場向けモデル 市場ごとに個別撮影 プロンプトでモデルイメージを切り替え

💡 コストに関するヒント: Nano Banana Proは従量課金制で、1K/2Kクラスの単価は約$0.05からです。SKU数が多く、大量の画像生成が必要な場合は、APIYI (apiyi.com) の集約API経由での呼び出しをお勧めします。従量課金で高並列処理にも対応しており、1日数百枚を生成するアパレル画像生成パイプラインに適しています。

強調しておきたいのは、AI画像生成は現時点では詳細ページやシーン画像の代替として最も適しており、メイン画像やファッションショー級のビジュアルについては、依然として一部リアルな撮影を残すことを推奨します。業界全体がリアルからAIへの移行期にあるため、まずはAIでリスクの低い画像から着手し、成功体験を積み重ねるのが賢明なステップです。

Nano Banana Pro 平面図から着用画像への変換:5ステップワークフロー

本題に入りましょう。ワークフローは「素材準備」「プロンプト構築」「API呼び出し」「詳細チェック」「バッチ拡張」の5ステップで構成されます。最初の2ステップが生成品質の上限を決め、後の3ステップが効率と安定性を左右します。

nano-banana-pro-flat-lay-to-model-photo-apparel-workflow-ja 图示

第 1 ステップ:適切な衣類の平置き画像素材を準備する

元画像の品質が、着用画像の仕上がりを直接左右します。モデルは平置き画像から服の形状、生地の質感、柄の位置を読み取るため、ぼやけていたりシワが多かったりすると情報が歪んでしまいます。適切な素材は以下の条件を満たす必要があります。

  1. 解像度が1024px以上であり、プリントやロゴが鮮明であること。
  2. 服が平らに広げられていること(大きなシワでシルエットが隠れないように)。
  3. 照明が均一で強い影がないこと(無地や明るい背景が最適)。
  4. 正面全体が写っていること(襟元、袖口、裾の境界が明確であること)。

ハンガーにかけた状態の画像もこのワークフローで使用可能です。むしろ、自然なドレープ感が出るため、平置きよりもシルエットが綺麗に再現されることが多いです。両方ある場合は、ハンガー画像を優先して使用してください。

第 2 ステップ:画像から画像生成(i2i)用プロンプトの構築(5要素構造)

Google公式のプロンプト推奨事項には、主体、構図、動作、シーン、スタイルの5つの要素が含まれています。平置き画像から着用画像への変換では、以下の構造化テンプレートを推奨します。核心となる原則は、まず服を固定し、その後にモデルとシーンを記述することです。

Generate an image: A [モデルの記述] wearing the exact garment from the
reference image, preserving the original fabric texture, print pattern,
buttons and stitching. [ポーズと動作]. [シーンと照明]. [構図とスタイル].

そのまま使えるプロンプト例(モデルの理解を安定させるため、英語での記述を推奨します):

Generate an image: A young East Asian female model wearing the exact
floral linen shirt from the reference image, preserving the original
print pattern, collar shape and button details. Standing naturally with
one hand in pocket. Bright studio with soft daylight, light gray
backdrop. Full-body shot, 3:4 ratio, e-commerce fashion photography style.

preserving the original... の部分は、プロンプトの魂とも言える箇所です。保全が必要な詳細(柄、襟の形、ボタンなど)を明確にリストアップすることで、モデルによる再現率が劇的に向上します。

第 3 ステップ:Nano Banana Pro API を呼び出して画像生成を実行する

Nano Banana Pro は Gemini のネイティブインターフェース形式を採用しており、モデル名は gemini-3-pro-image-preview です。以下は最小限の呼び出し例です。平置き画像をBase64形式に変換し、プロンプトと一緒に送信します。

import requests, base64

# APIYIのAPIエンドポイント
API_URL = "https://api.apiyi.com/v1beta/models/gemini-3-pro-image-preview:generateContent"
headers = {"x-goog-api-key": "YOUR_API_KEY"}

with open("flat-lay-shirt.png", "rb") as f:
    img_b64 = base64.b64encode(f.read()).decode()

payload = {
    "contents": [{"parts": [
        {"text": "Generate an image: A female model wearing the exact shirt from the reference image, preserving print and buttons. Studio lighting, full-body, e-commerce style."},
        {"inline_data": {"mime_type": "image/png", "data": img_b64}}
    ]}],
    "generationConfig": {"imageConfig": {"aspectRatio": "3:4", "imageSize": "2K"}}
}

resp = requests.post(API_URL, headers=headers, json=payload, timeout=300)
print(resp.status_code)  # 返されたinlineDataが生成画像のBase64データです

注意すべきパラメータが2つあります。aspectRatio を 3:4 に設定するのは、主要なECサイトのメイン画像規格に合わせるためです。imageSize は 2K が鮮明さとコストのバランスが最も良く、拡大・トリミングが必要な場合は 4K ですが時間がかかります。タイムアウト設定は360秒程度にしておくのが安心です。

🎯 導入のアドバイス: Nano Banana Pro の公式チャネル(Vertex / AI Studio)は、ピーク時に503エラーが発生することがあり、大量の画像生成を行うショップには影響が出る場合があります。APIYI (apiyi.com) を経由しての接続をおすすめします。マルチチャネル冗長化が施されており、同じキーで gpt-image-2 などのモデルと効果を比較することも可能です。

第 4 ステップ:詳細保全のチェック(出品前の必須確認)

AI生成モデル画像がそのまま出品できるかどうかは、実物との一致度にかかっています。「写真と違う」というクレームは返品の主な原因です。生成された各画像に対し、以下のリストでチェックを行ってください。

チェック項目 内容 不合格の典型例
プリント柄 位置、サイズ、完全性 柄が「再創造」されている、位置ズレ
色の再現性 元画像との色値の一致 全体的な色被り、彩度のズレ
シルエット 形状、丈、ゆとり感 ウエストが絞られすぎている、丈が違う
細部パーツ ボタン数、ファスナー、ポケット ボタンの増減、ポケットの消失
人体の自然さ 手、顔、肢体の比率 指の奇形、体が服を突き抜けている

チェックに不合格だった場合でも、最初からやり直す必要はありません。Nano Banana Pro は対話形式の編集をサポートしているため、追加の指示を出すだけで修正可能です。例えば Keep everything unchanged, only restore the chest print to match the reference image exactly と指示すれば、合格している部分を維持したまま効率的に修正できます。

第 5 ステップ:モデルやシーンのバッチ拡張

1着のチェックが完了したら、バッチ処理で展開しましょう。服を固定する指示はそのままに、モデルやシーンの記述だけを入れ替えます。1枚の平置き画像から、スタジオ撮影、ストリートスナップ、カフェでの撮影など、複数のバリエーションを生成したり、欧米、中東、東南アジアなどターゲット市場に合わせて異なるモデルを生成したりできます。

バッチ処理のポイントは、並列数と失敗時のリトライ制御です。Nano Banana Pro の生成時間は10秒から1分程度かかるため、5〜10の並列数でキューを管理し、失敗したタスクは自動で1回リトライするように設定することをお勧めします。大規模なパイプラインが必要な場合は、APIYI (help.apiyi.com) のヘルプセンターにあるバッチ生成と並列最適化のドキュメントを参照してください。すぐに使えるキュー管理スクリプトが用意されています。

Nano Banana Pro 服装细节保真:プロンプトの高度な書き方

ワークフローを構築するだけでは合格点に過ぎません。画像生成の品質に決定的な差を生むのは、プロンプトによる服装のディテール制御力です。本セクションでは、海外コミュニティにおける35組のプロンプト検証結果を要約します。核心は一言、**「素材を先に、スタイルを後に(fabric before style)」**です。

nano-banana-pro-flat-lay-to-model-photo-apparel-workflow-ja 图示

検証データによると、プロンプトに素材の種類を明記(例:ribbed cotton、washed denim、silk satin)した場合、10回の生成のうち約8回で質感の信頼できる結果が得られました。一方、clothingやshirtといった汎用的な単語を使った場合、信頼できる結果は約3回に留まりました。これは、素材を示す単語が、モデルに対して光沢、シワ、ドレープ感をどのようにレンダリングすべきかを直接指示するためです。シルクには光沢の流動感を、デニムには斜文織りの肌理を、ニットにはリブ構造を、これらはすべてプロンプトによる明示的なトリガーに依存しています。

詳細タイプ 推奨される書き方 役割
素材の質感 ribbed cotton knit / washed denim / silk satin 正確な光沢とシワのレンダリングを誘発
プリントの固定 preserving the original print pattern exactly パターンの再解釈(改変)を防止
パーツの固定 keep all buttons, zippers and stitching unchanged ボタンの増減や縫い目の消失を防止
色の固定 the exact same color as the reference image 色のドリフト(ズレ)を抑制
光と影の雰囲気 soft daylight / golden hour backlighting 撮影用語でライティングを制御

もう一つの高度なテクニックは、参照画像に「役割を割り当てる」ことです。複数の画像を一度に入力する場合(例:平置き画像+モデルのポーズ参照+背景参照)、プロンプト内でそれぞれの用途を説明します:Image 1 is the garment source, image 2 is the pose reference, image 3 is the background。Nano Banana Proはマルチモーダルな役割理解に優れており、役割を明確に分担させることで、画像混同によるエラーが大幅に減少します。

📘 モデル選択のヒント: 服装画像が単色のベーシックなアイテム中心であれば、Nano Banana 2(Proではないモデル)の方が単価が安く、速度も速いため、コストパフォーマンスが高い場合があります。プリントが複雑でディテールが多いアイテムにはProを使用しましょう。両モデルはAPIYI(apiyi.com)プラットフォームで同じAPIキーを使用して切り替え可能です。各10枚ほど生成して比較し、主力モデルを決めることをお勧めします。

平置き画像から着用画像への変換における失敗と修正案

プロンプトを適切に書いても、服装というカテゴリには頻発する失敗ポイントがいくつか存在します。修正方法を事前に知っておくことで、再生成にかかるコストを大幅に削減できます。

失敗現象 根本原因 修正案
型崩れ(ウエストが絞られず直筒になる) 平置き画像では立体的なシルエットが表現できない ハンガー掛け画像に変更するか、プロンプトに slim-fit waist などのシルエット記述を追加
色のドリフト(ズレ) シーンの光線記述が暖色/寒色に偏っている exact same color を追加して固定し、シーンの光を中立な neutral studio lighting に変更
プリントの再描画 パターンが明示的に固定されていない preserving the print exactly を追加し、ソース画像内のプリント領域を高解像度に保つ
背面のディテールが捏造される ソース画像に正面情報しかない 背面画像を追加提供する。モデルに推測させない
手や顔の歪み 人物生成における固有の難点 ポケットに手を入れる、バッグを持つなど、隠れるポーズに変更するか、複数回の編集で部分的に修正
安全フィルターに抵触 着せ替え系の指示がセンシティブと判断される wearing the garment from the reference といったポジティブな表現を使い、swap/replaceといった言葉を避ける

特に「色のドリフト」について補足します。これは服装系AI生成における最大のクレーム要因であり、色差は直接返品率に直結します。プロンプトによる固定以外に、生成画像とソース画像を同じ画面で色値比較するのが最も確実です。メインカラーのHEX値に明らかな偏差がある場合は、後処理での色補正を試みず、即座に再生成してください。色補正を行うと、モデルの肌色まで一緒に変わってしまうためです。

大量生産の現場では、上記の修正指示を「プリセットライブラリ」として保存しておくことを推奨します。チェックリストで不合格となった項目に対し、自動的に対応する修正プロンプトを追加して再編集を行う運用です。この仕組みをAPIYI(apiyi.com)の高並列APIと組み合わせることで、1着の服装を平置き画像から合格レベルの着用画像へ仕上げる処理時間を10分以内に短縮可能です。

よくある質問

Q1: 平置き画像から着用画像への変換、Nano Banana Proとgpt-image-2はどちらを選ぶべき?

Nano Banana Proは、生地の質感や刺繍などの繊細なディテールの再現性に優れており、複数回の編集・修正にも対応しているため、複雑なプリント柄のアイテムに適しています。一方、gpt-image-2はデザイン性の高い構図や文字のレンダリングに強みがあり、ポスターのような見栄えを重視するシーンに向いています。APIYI(apiyi.com)上で同じソース画像を使ってそれぞれ10枚ずつテストし、ご自身の取り扱い商品で実測してから主力モデルを決めることをおすすめします。

Q2: 生成されたAIモデル画像は、そのままECサイトに掲載できますか?

技術的には可能ですが、2点注意が必要です。1点目は、一部のプラットフォームではAI生成コンテンツの明記が求められるため、掲載前に各プラットフォームの最新ポリシーを確認すること。2点目は、画像が商品を正確に反映している必要があることです。プリント柄や色が実物と異なると、返品やクレームの原因になるため、必ず第4ステップの「詳細チェックリスト」を完了させてください。

Q3: 1枚の平置き画像から、最大で何枚の着用画像を作成できますか?

実務上、適切なソース画像1枚から、品質基準を満たすバリエーション(モデル、ポーズ、シーンの組み合わせ)を安定して20〜50枚生成可能です。それ以上生成を続けると、画像が似通ってしまい、追加する価値が低下します。多色展開の場合は、プロンプトで色を変更するのではなく、色ごとに個別のソース画像を用意してください。そうしないと、色味の再現性が低くなるリスクがあります。

Q4: API呼び出し時に503エラーや生成失敗が発生した場合は?

Nano Banana Proの公式チャンネルでは、混雑時に503エラーによる制限がかかることがあります。バッチ処理を行う場合は、自動リトライやダウングレード処理(失敗時にNano Banana 2へ切り替えるなど)を組み込むことを推奨します。APIYI(apiyi.com)経由で呼び出す場合は、プラットフォーム側でマルチチャネルの冗長化を行っているため失敗率は大幅に低減されます。安定性に問題がある場合は、技術サポートまで直接お問い合わせください。

まとめ

平置き画像から着用画像への変換は、現在のアパレルECにおいて最も投資対効果(ROI)の高いAI活用シーンです。ソース素材はコストがほぼゼロ(SKUごとに平置き撮影は必須のため)であり、生成されたAIモデル画像は、最もコストのかかる実写モデル撮影を直接代替できます。本記事で紹介した5ステップのワークフロー(素材準備、5要素プロンプト、API呼び出し、詳細チェック、バッチ拡張)と、「生地を優先し、その後にスタイルを指定する」というプロンプトの原則、そして6つの失敗回避策を組み合わせれば、単一商品のテストから1日数百枚の量産体制まで十分に構築可能です。

業界は現在、実写撮影からAI活用へと移行する初期段階にあります。まずは商品詳細ページやシーン画像をAIパイプラインに移行し、データを蓄積してから範囲を広げていくのが、現在最も確実な成功ルートです。実測を始める準備ができたら、APIYI(apiyi.com)に登録してテスト用クレジットを受け取り、記事内のコードテンプレートを使って最初の1枚を生成し、そこから徐々にバッチ処理能力を拡張してみてください。


著者: APIYI Team
技術サポート: 本記事で紹介したNano Banana Pro、gpt-image-2などのモデルは、すべてAPIYI(apiyi.com)の統一インターフェースを通じて呼び出し可能です。新規登録で無料テストクレジットを配布しています。

類似投稿