手里只有服装平铺图或挂拍图,却需要模特上身效果图——这是服装电商运营最高频的出图需求。真人拍摄一场下来,模特费、摄影师、场地、修图加起来动辄数千美元,周期还要 1-2 周;而 SHEIN 这类快时尚巨头每年的拍摄费用更是以亿计。本文将介绍 Nano Banana Pro 平铺图转上身图的 5 步工作流,帮助你用图生图(i2i)能力把一张平铺图变成可直接上架的 AI 模特图。
核心价值: 读完本文,你将掌握平铺图转上身图的完整 API 工作流、服装细节保真的提示词写法,以及版型变形、颜色漂移等常见翻车点的修复方法,单张出图成本可以控制在 0.1 美元级别。

平铺图转上身图核心要点:Nano Banana Pro 能力解析
Nano Banana Pro 是 Google DeepMind 发布的 Gemini 3 Pro Image 模型的社区昵称,2025 年 11 月上线后迅速成为服装类图生图的首选。它能把平面的服装图「穿」到 AI 生成的模特身上,同时保留面料纹理、印花图案和自然光影,这正是平铺图转上身图场景最依赖的能力。
| 核心能力 | 说明 | 对服装场景的价值 |
|---|---|---|
| 多图输入 | 单次最多支持 14 张参考图 | 平铺图 + 模特参考 + 场景图可同时输入 |
| 细节保真 | 将图案、Logo 自然贴合到 3D 表面并保留光影 | 印花、绣花、纽扣不走样 |
| 分辨率档位 | 1K / 2K / 4K 三档输出 | 详情页用 2K,主图放大用 4K |
| 多轮一致性 | 支持多轮对话编辑,人物形象保持稳定 | 同一模特生成正面、侧面多角度图 |
| 比例控制 | 通过 aspectRatio 参数指定宽高比 | 适配电商平台 3:4、1:1 等主图规范 |
Nano Banana Pro 服装出图的成本账
成本是服装商家从真人拍摄转向 AI 出图的核心动力。海外社区的实测数据显示,一场传统服装拍摄的综合成本在 3,500 美元以上,周期 1-2 周;而用 AI 生成 50 张以上的变体图,花费仅 10-35 美元,几分钟内完成。
| 对比维度 | 真人模特拍摄 | Nano Banana Pro 出图 |
|---|---|---|
| 单场综合成本 | $3,500 起 | $10-35(50 张变体) |
| 单张成本 | 摊薄后约 $50-100 | 约 $0.05-0.134(随分辨率) |
| 交付周期 | 1-2 周 | 数分钟 |
| 改款重拍 | 需重新约模特和场地 | 改提示词重新生成 |
| 多市场模特 | 每个市场单独拍摄 | 提示词切换模特形象 |
💡 成本提示: Nano Banana Pro 按次计费,1K/2K 档单价约 $0.05 起。如果你的 SKU 量大、需要批量出图,我们建议通过 API易 apiyi.com 的聚合接口调用,按量计费且支持高并发,适合日产数百张的服装出图管线。
需要强调的是,AI 出图目前最适合先替代详情页和场景图,主图和秀场级大片仍建议保留部分真人拍摄。行业整体处于真人转 AI 的初期,先用 AI 跑通低风险图类,是更稳妥的切入节奏。
Nano Banana Pro 平铺图转上身图 5 步工作流
下面进入正题。整个工作流分为 5 步:素材准备 → 提示词构建 → API 调用 → 细节验收 → 批量扩展。前两步决定出图质量的上限,后三步决定效率和稳定性。

第 1 步:准备合格的服装平铺图素材
源图质量直接决定上身效果。模型需要从平铺图中理解服装的版型边界、面料质感和图案位置,模糊或褶皱严重的源图会让这些信息失真。合格的平铺图素材应满足以下条件:
- 分辨率不低于 1024px,印花和 Logo 区域清晰可辨;
- 服装平整摊开,避免大面积褶皱遮挡版型轮廓;
- 光照均匀无强阴影,纯色或浅色背景最佳;
- 正面完整入镜,领口、袖口、下摆边界清晰。
挂拍图(衣架拍摄)同样适用本工作流,而且因为自带垂坠形态,版型还原通常比纯平铺图更好。如果手里两种素材都有,优先用挂拍图做源图。
第 2 步:构建 i2i 提示词(五要素结构)
Google 官方的提示词建议包含五个要素:主体、构图、动作、场景、风格。落到平铺图转上身图场景,推荐使用下面这个结构化模板,核心原则是先锁定服装,再描述模特和场景:
Generate an image: A [模特描述] wearing the exact garment from the
reference image, preserving the original fabric texture, print pattern,
buttons and stitching. [姿势与动作]. [场景与光线]. [构图与风格].
一个可直接套用的中文场景示例(提示词建议用英文,模型理解更稳定):
Generate an image: A young East Asian female model wearing the exact
floral linen shirt from the reference image, preserving the original
print pattern, collar shape and button details. Standing naturally with
one hand in pocket. Bright studio with soft daylight, light gray
backdrop. Full-body shot, 3:4 ratio, e-commerce fashion photography style.
注意 preserving the original... 这一段是整条提示词的灵魂,明确列出需要保真的细节(印花、领型、纽扣),模型对这些元素的还原率会显著提升。后文细节保真章节会展开讲这套写法的原理。
第 3 步:调用 Nano Banana Pro API 执行图生图
Nano Banana Pro 走 Gemini 原生接口格式,模型名为 gemini-3-pro-image-preview。下面是极简调用示例,把平铺图以 base64 形式和提示词一起提交:
import requests, base64
API_URL = "https://api.apiyi.com/v1beta/models/gemini-3-pro-image-preview:generateContent"
headers = {"x-goog-api-key": "YOUR_API_KEY"}
with open("flat-lay-shirt.png", "rb") as f:
img_b64 = base64.b64encode(f.read()).decode()
payload = {
"contents": [{"parts": [
{"text": "Generate an image: A female model wearing the exact shirt from the reference image, preserving print and buttons. Studio lighting, full-body, e-commerce style."},
{"inline_data": {"mime_type": "image/png", "data": img_b64}}
]}],
"generationConfig": {"imageConfig": {"aspectRatio": "3:4", "imageSize": "2K"}}
}
resp = requests.post(API_URL, headers=headers, json=payload, timeout=300)
print(resp.status_code) # 返回的 inlineData 即生成图的 base64
两个参数值得注意:aspectRatio 设为 3:4 是为了适配主流电商平台的服装主图规范;imageSize 选 2K 在清晰度和成本之间最平衡,4K 适合需要放大裁切的场景但耗时更长,建议把超时设到 360 秒。
🎯 接入建议: Nano Banana Pro 官方渠道(Vertex / AI Studio)在高峰期偶发 503 限流,对批量出图的服装卖家影响较大。我们建议通过 API易 apiyi.com 接入,平台做了多通道冗余,同一个 Key 还能切换 gpt-image-2 等模型做效果对比,免去多平台注册和绑卡流程。
第 4 步:细节保真验收(上架前必查)
AI 模特图能不能直接上架,取决于服装细节与实物的一致程度——图不对版是电商退货的重灾区。每张生成图建议按下面的清单逐项核对:
| 验收项 | 检查内容 | 不合格的典型表现 |
|---|---|---|
| 印花图案 | 位置、大小、完整性 | 图案被「重新创作」、位置偏移 |
| 颜色还原 | 主色与源图色值一致 | 整体偏色、饱和度漂移 |
| 版型轮廓 | 廓形、长度、宽松度 | 收腰变直筒、短款变长款 |
| 细节件 | 纽扣数量、拉链、口袋 | 纽扣增减、口袋消失 |
| 人体合理性 | 手部、面部、肢体比例 | 手指畸形、肢体穿模 |
验收不通过不必整张重生成。Nano Banana Pro 支持多轮对话编辑,直接追加一条指令即可定向修复,例如 Keep everything unchanged, only restore the chest print to match the reference image exactly,这样比重抽一次更省成本,也避免已合格的部分被改动。
第 5 步:批量扩展多模特多场景
单款验收通过后,就可以批量裂变了。保持服装锁定指令不变,只替换模特和场景描述,一张平铺图可以扩展出整组素材:同一款衬衫生成棚拍、街拍、咖啡馆三种场景,或为欧美、中东、东南亚市场分别生成不同形象的 AI 模特图。
批量阶段的工程要点是控制并发和失败重试。Nano Banana Pro 单次生成耗时在十几秒到一分钟不等,建议用 5-10 的并发数跑队列,失败任务自动重试一次。如果管线规模较大,可以参考 API易 help.apiyi.com 帮助中心的批量出图与并发优化文档,里面有现成的队列脚本可以改。
Nano Banana Pro 服装细节保真:提示词进阶写法
工作流跑通只是及格线,真正拉开出图质量差距的是提示词对服装细节的控制力。这一节是海外社区 35 组提示词变体实测结论的提炼,核心就一句话:先面料,后风格(fabric before style)。

实测数据显示,提示词中明确写出面料类型(如 ribbed cotton、washed denim、silk satin)时,10 次生成中约 8 次能得到质感可信的结果;而用 clothing、shirt 这类泛化词,可信结果只有约 3 次。原因在于面料词直接决定了模型如何渲染光泽、褶皱和垂坠感——丝绸要有光泽流动,牛仔要有斜纹肌理,针织要有罗纹结构,这些都依赖提示词显式触发。
| 细节类型 | 推荐写法 | 作用 |
|---|---|---|
| 面料质感 | ribbed cotton knit / washed denim / silk satin |
触发正确的光泽与褶皱渲染 |
| 印花锁定 | preserving the original print pattern exactly |
防止图案被二次创作 |
| 细节件锁定 | keep all buttons, zippers and stitching unchanged |
防止纽扣增减、缝线消失 |
| 色彩锚定 | the exact same color as the reference image |
抑制颜色漂移 |
| 光影氛围 | soft daylight / golden hour backlighting |
用摄影术语控制布光 |
另一个高频技巧是给参考图「分配角色」。当一次传入多张图时(比如平铺图 + 模特姿势参考 + 背景参考),在提示词里逐张说明用途:Image 1 is the garment source, image 2 is the pose reference, image 3 is the background。Nano Banana Pro 对多图角色的理解相当好,明确分工后混图错乱率明显下降。
📘 模型选择参考: 如果你的服装图以净色基本款为主,Nano Banana 2(非 Pro)的单价更低、速度更快,性价比可能更高;印花复杂、细节多的款式再上 Pro。两个模型在 API易 apiyi.com 平台可以用同一个 Key 直接切换,建议各跑 10 张对比后再定主力模型。
平铺图转上身图常见翻车点与修复方案
即使提示词写得规范,服装这个品类仍有几个高频翻车点。提前知道怎么修,能省下大量重抽成本。
| 翻车现象 | 根本原因 | 修复方案 |
|---|---|---|
| 版型变形(收腰变直筒) | 平铺图无法表达立体版型 | 换挂拍图做源图,或提示词补充廓形描述如 slim-fit waist |
| 颜色漂移 | 场景光线描述带暖色/冷色倾向 | 加 exact same color 锚定,场景光改为中性 neutral studio lighting |
| 印花被重绘 | 未显式锁定图案 | 加 preserving the print exactly,印花区在源图中保持高清 |
| 背面细节编造 | 源图只有正面信息 | 背面图必须额外提供背面平铺图,不要让模型猜 |
| 手部/面部畸形 | 人物生成的固有难点 | 姿势改为手插口袋、手持包等遮挡姿势,或多轮编辑定向修手 |
| 触发安全拦截 | 换装类指令措辞敏感 | 改用 wearing the garment from the reference 的正向描述,避免 swap/replace 真人照片类措辞 |
这里特别说明颜色漂移:它是服装类 AI 出图的第一大投诉来源,因为色差直接关联退货率。除了提示词锚定,更可靠的做法是把生成图与源图在同一屏做色值对比,主色 HEX 偏差明显时直接重生成,不要试图靠后期校色挽救——校色会连模特肤色一起改掉。
批量生产场景下,建议把上面的修复指令做成「预案库」,验收清单中哪一项不合格,就自动追加对应的修复提示词跑多轮编辑。这套机制配合 API易 apiyi.com 的高并发通道,可以把单款服装从平铺图到全套合格上身图的处理时间压缩到 10 分钟以内。
常见问题
Q1: 平铺图转上身图,Nano Banana Pro 和 gpt-image-2 怎么选?
Nano Banana Pro 在面料纹理、绣花等精细细节的还原上更强,且支持多轮编辑修复,适合印花复杂的款式;gpt-image-2 在设计感构图和文字渲染上有优势,适合需要海报化呈现的场景。建议在 API易 apiyi.com 上用同一组源图各测 10 张,按自己的品类实测后再定主力。
Q2: 生成的 AI 模特图可以直接上架电商平台吗?
技术上可以,但要注意两点:一是部分平台要求 AI 生成内容标注,上架前确认目标平台的最新政策;二是图片必须如实反映商品,印花、颜色与实物不符可能引发退货和投诉,务必走完第 4 步的细节验收清单。
Q3: 一张平铺图最多能裂变出多少张可用的上身图?
实践中一张合格源图通常能稳定产出 20-50 张通过验收的变体(不同模特、姿势、场景组合)。继续裂变会出现明显的同质化,边际价值下降。多色同款建议每个色提供独立源图,不要靠提示词改色,否则色差风险高。
Q4: 调用时遇到 503 或生成失败怎么办?
Nano Banana Pro 官方渠道高峰期会出现 503 限流,批量任务建议加入自动重试和降级逻辑(如失败后切换 Nano Banana 2)。通过 API易 apiyi.com 调用时平台侧已做多通道冗余,失败率会低不少,遇到稳定性问题也可以直接找技术支持排查。
总结
平铺图转上身图是服装电商当前回报率最高的 AI 出图场景:源素材几乎零成本(每个 SKU 本来就要拍平铺图),产出的 AI 模特图直接替代最烧钱的真人上身拍摄。本文的 5 步工作流——素材准备、五要素提示词、API 调用、细节验收、批量扩展——配合「先面料后风格」的提示词原则和六大翻车点预案,足以支撑从单款测试到日产数百张的规模化管线。
行业正处在真人拍摄向 AI 转化的初期窗口,先把详情页和场景图迁移到 AI 管线,跑出数据后再逐步扩大范围,是目前验证下来最稳的路径。如果你准备开始实测,可以在 API易 apiyi.com 注册后领取测试额度,用本文的代码模板把第一张平铺图跑通,再逐步叠加批量能力。
作者: APIYI Team
技术支持: 本文涉及的 Nano Banana Pro、gpt-image-2 等模型均可通过 API易 apiyi.com 统一接口调用,新用户注册可领取免费测试额度。
