手裏只有服裝平鋪圖或掛拍圖,卻需要模特上身效果圖——這是服裝電商運營最高頻的出圖需求。真人拍攝一場下來,模特費、攝影師、場地、修圖加起來動輒數千美元,週期還要 1-2 周;而 SHEIN 這類快時尚巨頭每年的拍攝費用更是以億計。本文將介紹 Nano Banana Pro 平鋪圖轉上身圖的 5 步工作流,幫助你用圖生圖(i2i)能力把一張平鋪圖變成可直接上架的 AI 模特圖。
核心價值: 讀完本文,你將掌握平鋪圖轉上身圖的完整 API 工作流、服裝細節保真的提示詞寫法,以及版型變形、顏色漂移等常見翻車點的修復方法,單張出圖成本可以控制在 0.1 美元級別。

平鋪圖轉上身圖核心要點:Nano Banana Pro 能力解析
Nano Banana Pro 是 Google DeepMind 發佈的 Gemini 3 Pro Image 模型的社區暱稱,2025 年 11 月上線後迅速成爲服裝類圖生圖的首選。它能把平面的服裝圖「穿」到 AI 生成的模特身上,同時保留面料紋理、印花圖案和自然光影,這正是平鋪圖轉上身圖場景最依賴的能力。
| 核心能力 | 說明 | 對服裝場景的價值 |
|---|---|---|
| 多圖輸入 | 單次最多支持 14 張參考圖 | 平鋪圖 + 模特參考 + 場景圖可同時輸入 |
| 細節保真 | 將圖案、Logo 自然貼合到 3D 表面並保留光影 | 印花、繡花、紐扣不走樣 |
| 分辨率檔位 | 1K / 2K / 4K 三檔輸出 | 詳情頁用 2K,主圖放大用 4K |
| 多輪一致性 | 支持多輪對話編輯,人物形象保持穩定 | 同一模特生成正面、側面多角度圖 |
| 比例控制 | 通過 aspectRatio 參數指定寬高比 | 適配電商平臺 3:4、1:1 等主圖規範 |
Nano Banana Pro 服裝出圖的成本賬
成本是服裝商家從真人拍攝轉向 AI 出圖的核心動力。海外社區的實測數據顯示,一場傳統服裝拍攝的綜合成本在 3,500 美元以上,週期 1-2 周;而用 AI 生成 50 張以上的變體圖,花費僅 10-35 美元,幾分鐘內完成。
| 對比維度 | 真人模特拍攝 | Nano Banana Pro 出圖 |
|---|---|---|
| 單場綜合成本 | $3,500 起 | $10-35(50 張變體) |
| 單張成本 | 攤薄後約 $50-100 | 約 $0.05-0.134(隨分辨率) |
| 交付週期 | 1-2 周 | 數分鐘 |
| 改款重拍 | 需重新約模特和場地 | 改提示詞重新生成 |
| 多市場模特 | 每個市場單獨拍攝 | 提示詞切換模特形象 |
💡 成本提示: Nano Banana Pro 按次計費,1K/2K 檔單價約 $0.05 起。如果你的 SKU 量大、需要批量出圖,我們建議通過 API易 apiyi.com 的聚合接口調用,按量計費且支持高併發,適合日產數百張的服裝出圖管線。
需要強調的是,AI 出圖目前最適合先替代詳情頁和場景圖,主圖和秀場級大片仍建議保留部分真人拍攝。行業整體處於真人轉 AI 的初期,先用 AI 跑通低風險圖類,是更穩妥的切入節奏。
Nano Banana Pro 平鋪圖轉上身圖 5 步工作流
下面進入正題。整個工作流分爲 5 步:素材準備 → 提示詞構建 → API 調用 → 細節驗收 → 批量擴展。前兩步決定出圖質量的上限,後三步決定效率和穩定性。

第 1 步:準備合格的服裝平鋪圖素材
源圖質量直接決定上身效果。模型需要從平鋪圖中理解服裝的版型邊界、面料質感和圖案位置,模糊或褶皺嚴重的源圖會讓這些信息失真。合格的平鋪圖素材應滿足以下條件:
- 分辨率不低於 1024px,印花和 Logo 區域清晰可辨;
- 服裝平整攤開,避免大面積褶皺遮擋版型輪廓;
- 光照均勻無強陰影,純色或淺色背景最佳;
- 正面完整入鏡,領口、袖口、下襬邊界清晰。
掛拍圖(衣架拍攝)同樣適用本工作流,而且因爲自帶垂墜形態,版型還原通常比純平鋪圖更好。如果手裏兩種素材都有,優先用掛拍圖做源圖。
第 2 步:構建 i2i 提示詞(五要素結構)
Google 官方的提示詞建議包含五個要素:主體、構圖、動作、場景、風格。落到平鋪圖轉上身圖場景,推薦使用下面這個結構化模板,核心原則是先鎖定服裝,再描述模特和場景:
Generate an image: A [模特描述] wearing the exact garment from the
reference image, preserving the original fabric texture, print pattern,
buttons and stitching. [姿勢與動作]. [場景與光線]. [構圖與風格].
一個可直接套用的中文場景示例(提示詞建議用英文,模型理解更穩定):
Generate an image: A young East Asian female model wearing the exact
floral linen shirt from the reference image, preserving the original
print pattern, collar shape and button details. Standing naturally with
one hand in pocket. Bright studio with soft daylight, light gray
backdrop. Full-body shot, 3:4 ratio, e-commerce fashion photography style.
注意 preserving the original... 這一段是整條提示詞的靈魂,明確列出需要保真的細節(印花、領型、紐扣),模型對這些元素的還原率會顯著提升。後文細節保真章節會展開講這套寫法的原理。
第 3 步:調用 Nano Banana Pro API 執行圖生圖
Nano Banana Pro 走 Gemini 原生接口格式,模型名爲 gemini-3-pro-image-preview。下面是極簡調用示例,把平鋪圖以 base64 形式和提示詞一起提交:
import requests, base64
API_URL = "https://api.apiyi.com/v1beta/models/gemini-3-pro-image-preview:generateContent"
headers = {"x-goog-api-key": "YOUR_API_KEY"}
with open("flat-lay-shirt.png", "rb") as f:
img_b64 = base64.b64encode(f.read()).decode()
payload = {
"contents": [{"parts": [
{"text": "Generate an image: A female model wearing the exact shirt from the reference image, preserving print and buttons. Studio lighting, full-body, e-commerce style."},
{"inline_data": {"mime_type": "image/png", "data": img_b64}}
]}],
"generationConfig": {"imageConfig": {"aspectRatio": "3:4", "imageSize": "2K"}}
}
resp = requests.post(API_URL, headers=headers, json=payload, timeout=300)
print(resp.status_code) # 返回的 inlineData 即生成圖的 base64
兩個參數值得注意:aspectRatio 設爲 3:4 是爲了適配主流電商平臺的服裝主圖規範;imageSize 選 2K 在清晰度和成本之間最平衡,4K 適合需要放大裁切的場景但耗時更長,建議把超時設到 360 秒。
🎯 接入建議: Nano Banana Pro 官方渠道(Vertex / AI Studio)在高峯期偶發 503 限流,對批量出圖的服裝賣家影響較大。我們建議通過 API易 apiyi.com 接入,平臺做了多通道冗餘,同一個 Key 還能切換 gpt-image-2 等模型做效果對比,免去多平臺註冊和綁卡流程。
第 4 步:細節保真驗收(上架前必查)
AI 模特圖能不能直接上架,取決於服裝細節與實物的一致程度——圖不對版是電商退貨的重災區。每張生成圖建議按下面的清單逐項覈對:
| 驗收項 | 檢查內容 | 不合格的典型表現 |
|---|---|---|
| 印花圖案 | 位置、大小、完整性 | 圖案被「重新創作」、位置偏移 |
| 顏色還原 | 主色與源圖色值一致 | 整體偏色、飽和度漂移 |
| 版型輪廓 | 廓形、長度、寬鬆度 | 收腰變直筒、短款變長款 |
| 細節件 | 紐扣數量、拉鍊、口袋 | 紐扣增減、口袋消失 |
| 人體合理性 | 手部、面部、肢體比例 | 手指畸形、肢體穿模 |
驗收不通過不必整張重生成。Nano Banana Pro 支持多輪對話編輯,直接追加一條指令即可定向修復,例如 Keep everything unchanged, only restore the chest print to match the reference image exactly,這樣比重抽一次更省成本,也避免已合格的部分被改動。
第 5 步:批量擴展多模特多場景
單款驗收通過後,就可以批量裂變了。保持服裝鎖定指令不變,只替換模特和場景描述,一張平鋪圖可以擴展出整組素材:同一款襯衫生成棚拍、街拍、咖啡館三種場景,或爲歐美、中東、東南亞市場分別生成不同形象的 AI 模特圖。
批量階段的工程要點是控制併發和失敗重試。Nano Banana Pro 單次生成耗時在十幾秒到一分鐘不等,建議用 5-10 的併發數跑隊列,失敗任務自動重試一次。如果管線規模較大,可以參考 API易 help.apiyi.com 幫助中心的批量出圖與併發優化文檔,裏面有現成的隊列腳本可以改。
Nano Banana Pro 服裝細節保真:提示詞進階寫法
工作流跑通只是及格線,真正拉開出圖質量差距的是提示詞對服裝細節的控制力。這一節是海外社區 35 組提示詞變體實測結論的提煉,核心就一句話:先面料,後風格(fabric before style)。

實測數據顯示,提示詞中明確寫出面料類型(如 ribbed cotton、washed denim、silk satin)時,10 次生成中約 8 次能得到質感可信的結果;而用 clothing、shirt 這類泛化詞,可信結果只有約 3 次。原因在於面料詞直接決定了模型如何渲染光澤、褶皺和垂墜感——絲綢要有光澤流動,牛仔要有斜紋肌理,針織要有羅紋結構,這些都依賴提示詞顯式觸發。
| 細節類型 | 推薦寫法 | 作用 |
|---|---|---|
| 面料質感 | ribbed cotton knit / washed denim / silk satin |
觸發正確的光澤與褶皺渲染 |
| 印花鎖定 | preserving the original print pattern exactly |
防止圖案被二次創作 |
| 細節件鎖定 | keep all buttons, zippers and stitching unchanged |
防止紐扣增減、縫線消失 |
| 色彩錨定 | the exact same color as the reference image |
抑制顏色漂移 |
| 光影氛圍 | soft daylight / golden hour backlighting |
用攝影術語控制布光 |
另一個高頻技巧是給參考圖「分配角色」。當一次傳入多張圖時(比如平鋪圖 + 模特姿勢參考 + 背景參考),在提示詞裏逐張說明用途:Image 1 is the garment source, image 2 is the pose reference, image 3 is the background。Nano Banana Pro 對多圖角色的理解相當好,明確分工後混圖錯亂率明顯下降。
📘 模型選擇參考: 如果你的服裝圖以淨色基本款爲主,Nano Banana 2(非 Pro)的單價更低、速度更快,性價比可能更高;印花複雜、細節多的款式再上 Pro。兩個模型在 API易 apiyi.com 平臺可以用同一個 Key 直接切換,建議各跑 10 張對比後再定主力模型。
平鋪圖轉上身圖常見翻車點與修復方案
即使提示詞寫得規範,服裝這個品類仍有幾個高頻翻車點。提前知道怎麼修,能省下大量重抽成本。
| 翻車現象 | 根本原因 | 修復方案 |
|---|---|---|
| 版型變形(收腰變直筒) | 平鋪圖無法表達立體版型 | 換掛拍圖做源圖,或提示詞補充廓形描述如 slim-fit waist |
| 顏色漂移 | 場景光線描述帶暖色/冷色傾向 | 加 exact same color 錨定,場景光改爲中性 neutral studio lighting |
| 印花被重繪 | 未顯式鎖定圖案 | 加 preserving the print exactly,印花區在源圖中保持高清 |
| 背面細節編造 | 源圖只有正面信息 | 背面圖必須額外提供背面平鋪圖,不要讓模型猜 |
| 手部/面部畸形 | 人物生成的固有難點 | 姿勢改爲手插口袋、手持包等遮擋姿勢,或多輪編輯定向修手 |
| 觸發安全攔截 | 換裝類指令措辭敏感 | 改用 wearing the garment from the reference 的正向描述,避免 swap/replace 真人照片類措辭 |
這裏特別說明顏色漂移:它是服裝類 AI 出圖的第一大投訴來源,因爲色差直接關聯退貨率。除了提示詞錨定,更可靠的做法是把生成圖與源圖在同一屏做色值對比,主色 HEX 偏差明顯時直接重生成,不要試圖靠後期校色挽救——校色會連模特膚色一起改掉。
批量生產場景下,建議把上面的修復指令做成「預案庫」,驗收清單中哪一項不合格,就自動追加對應的修復提示詞跑多輪編輯。這套機制配合 API易 apiyi.com 的高併發通道,可以把單款服裝從平鋪圖到全套合格上身圖的處理時間壓縮到 10 分鐘以內。
常見問題
Q1: 平鋪圖轉上身圖,Nano Banana Pro 和 gpt-image-2 怎麼選?
Nano Banana Pro 在面料紋理、繡花等精細細節的還原上更強,且支持多輪編輯修復,適合印花複雜的款式;gpt-image-2 在設計感構圖和文字渲染上有優勢,適合需要海報化呈現的場景。建議在 API易 apiyi.com 上用同一組源圖各測 10 張,按自己的品類實測後再定主力。
Q2: 生成的 AI 模特圖可以直接上架電商平臺嗎?
技術上可以,但要注意兩點:一是部分平臺要求 AI 生成內容標註,上架前確認目標平臺的最新政策;二是圖片必須如實反映商品,印花、顏色與實物不符可能引發退貨和投訴,務必走完第 4 步的細節驗收清單。
Q3: 一張平鋪圖最多能裂變出多少張可用的上身圖?
實踐中一張合格源圖通常能穩定產出 20-50 張通過驗收的變體(不同模特、姿勢、場景組合)。繼續裂變會出現明顯的同質化,邊際價值下降。多色同款建議每個色提供獨立源圖,不要靠提示詞改色,否則色差風險高。
Q4: 調用時遇到 503 或生成失敗怎麼辦?
Nano Banana Pro 官方渠道高峯期會出現 503 限流,批量任務建議加入自動重試和降級邏輯(如失敗後切換 Nano Banana 2)。通過 API易 apiyi.com 調用時平臺側已做多通道冗餘,失敗率會低不少,遇到穩定性問題也可以直接找技術支持排查。
總結
平鋪圖轉上身圖是服裝電商當前回報率最高的 AI 出圖場景:源素材幾乎零成本(每個 SKU 本來就要拍平鋪圖),產出的 AI 模特圖直接替代最燒錢的真人上身拍攝。本文的 5 步工作流——素材準備、五要素提示詞、API 調用、細節驗收、批量擴展——配合「先面料後風格」的提示詞原則和六大翻車點預案,足以支撐從單款測試到日產數百張的規模化管線。
行業正處在真人拍攝向 AI 轉化的初期窗口,先把詳情頁和場景圖遷移到 AI 管線,跑出數據後再逐步擴大範圍,是目前驗證下來最穩的路徑。如果你準備開始實測,可以在 API易 apiyi.com 註冊後領取測試額度,用本文的代碼模板把第一張平鋪圖跑通,再逐步疊加批量能力。
作者: APIYI Team
技術支持: 本文涉及的 Nano Banana Pro、gpt-image-2 等模型均可通過 API易 apiyi.com 統一接口調用,新用戶註冊可領取免費測試額度。
