Tener solo fotos de ropa sobre plano o colgada, pero necesitar imágenes de modelos luciendo las prendas: esta es la necesidad más frecuente en la gestión de comercio electrónico de moda. Una sesión de fotos real implica gastos de modelos, fotógrafos, alquiler de estudio y edición, que fácilmente suman miles de dólares y requieren de 1 a 2 semanas de trabajo. Gigantes del fast fashion como SHEIN gastan cientos de millones al año en esto. En este artículo, te presentaré el flujo de trabajo de 5 pasos de Nano Banana Pro para convertir fotos de ropa plana en imágenes con modelo, ayudándote a usar la capacidad de imagen a imagen (i2i) para transformar una foto plana en una imagen de modelo lista para publicar.
Valor principal: Al terminar de leer, dominarás el flujo de trabajo completo de la API para convertir fotos planas, cómo redactar indicaciones (prompts) para preservar los detalles de la ropa y cómo solucionar errores comunes como deformaciones de patrón o cambios de color. El coste por imagen se puede controlar en el rango de los 0.1 dólares.

Puntos clave de la conversión de fotos planas a imágenes con modelo: Análisis de capacidades de Nano Banana Pro
Nano Banana Pro es el apodo comunitario del modelo Gemini 3 Pro Image lanzado por Google DeepMind. Tras su lanzamiento en noviembre de 2025, se convirtió rápidamente en la opción preferida para la generación de imágenes de moda. Puede "vestir" a un modelo generado por IA con una prenda plana, manteniendo la textura de la tela, los estampados y las luces y sombras naturales, que es precisamente la capacidad de la que más depende este escenario.
| Capacidad principal | Descripción | Valor para el escenario de moda |
|---|---|---|
| Entrada multimagen | Soporta hasta 14 imágenes de referencia | Entrada simultánea de foto plana + referencia de modelo + escena |
| Fidelidad de detalles | Ajusta naturalmente estampados y logos a superficies 3D conservando sombras | Estampados, bordados y botones sin distorsión |
| Niveles de resolución | Salida en 1K / 2K / 4K | 2K para páginas de detalle, 4K para imágenes principales |
| Consistencia multironda | Soporta edición en múltiples rondas, manteniendo la identidad del personaje | Generación de ángulos frontales y laterales con el mismo modelo |
| Control de proporción | Especifica la relación de aspecto mediante el parámetro aspectRatio | Adaptación a normas de plataformas (3:4, 1:1, etc.) |
El balance de costes de la generación de moda con Nano Banana Pro
El coste es el motor principal para que los comerciantes de moda pasen de sesiones reales a la generación por IA. Los datos de pruebas en comunidades extranjeras muestran que el coste total de una sesión de fotos tradicional supera los 3,500 dólares, con un ciclo de 1-2 semanas; mientras que generar más de 50 variantes con IA cuesta solo entre 10 y 35 dólares y se completa en minutos.
| Dimensión de comparación | Sesión con modelo real | Generación con Nano Banana Pro |
|---|---|---|
| Coste total por sesión | Desde $3,500 | $10-35 (50 variantes) |
| Coste por imagen | Aprox. $50-100 (diluido) | Aprox. $0.05-0.134 (según resolución) |
| Ciclo de entrega | 1-2 semanas | Minutos |
| Cambios y re-sesión | Requiere volver a contratar modelo y estudio | Cambiar el prompt y regenerar |
| Modelos para mercados | Sesión separada por mercado | Cambio de modelo mediante el prompt |
💡 Nota sobre costes: Nano Banana Pro se factura por uso, con un precio inicial de unos $0.05 por la resolución 1K/2K. Si tienes un gran volumen de SKU y necesitas generación masiva, recomendamos utilizar la interfaz agregada de APIYI (apiyi.com), que ofrece facturación por uso y soporte de alta concurrencia, ideal para flujos de trabajo de cientos de imágenes diarias.
Es importante destacar que la generación por IA es actualmente más adecuada para sustituir las imágenes de detalle y de escena; para las imágenes principales y de pasarela, se recomienda seguir utilizando sesiones reales. La industria se encuentra en una etapa inicial de transición de lo real a la IA; empezar por usar IA para tareas de bajo riesgo es el ritmo más seguro.
Flujo de trabajo de 5 pasos: De plano de producto a modelo con Nano Banana Pro
Entremos en materia. Todo el flujo de trabajo se divide en 5 pasos: preparación del material → construcción de la indicación → invocación del modelo → verificación de detalles → escalado por lotes. Los dos primeros pasos determinan el límite de calidad de la imagen, mientras que los tres últimos definen la eficiencia y la estabilidad.

Paso 1: Preparar material de imagen plana de calidad
La calidad de la imagen original determina directamente el resultado final. El modelo necesita entender los límites del corte, la textura de la tela y la posición de los patrones a partir de la imagen plana; si la imagen es borrosa o tiene demasiadas arrugas, la información se distorsionará. Un material de imagen plana adecuado debe cumplir con:
- Resolución no inferior a 1024px, con estampados y logos claramente distinguibles.
- Prenda extendida de forma plana, evitando arrugas grandes que oculten el contorno.
- Iluminación uniforme sin sombras fuertes, preferiblemente con fondo liso o claro.
- Vista frontal completa, con bordes de cuello, mangas y dobladillo claramente visibles.
Las imágenes colgadas (en percha) también funcionan bien con este flujo de trabajo y, al mantener una forma natural, la restauración del corte suele ser mejor que en una imagen plana. Si tienes ambos tipos, prioriza la imagen colgada.
Paso 2: Construir la indicación para imagen a imagen (estructura de cinco elementos)
Las sugerencias oficiales de Google indican incluir cinco elementos: sujeto, composición, acción, escena y estilo. Para el escenario de pasar de plano a modelo, recomendamos esta plantilla estructurada, cuyo principio central es bloquear primero la prenda y luego describir al modelo y la escena:
Generate an image: A [descripción del modelo] wearing the exact garment from the
reference image, preserving the original fabric texture, print pattern,
buttons and stitching. [postura y acción]. [escena e iluminación]. [composición y estilo].
Un ejemplo práctico en inglés (se recomienda usar inglés para las indicaciones, ya que la comprensión del modelo es más estable):
Generate an image: A young East Asian female model wearing the exact
floral linen shirt from the reference image, preserving the original
print pattern, collar shape and button details. Standing naturally with
one hand in pocket. Bright studio with soft daylight, light gray
backdrop. Full-body shot, 3:4 ratio, e-commerce fashion photography style.
Nota que la parte preserving the original... es el alma de la indicación; al listar explícitamente los detalles que deben mantenerse (estampados, tipo de cuello, botones), la tasa de fidelidad del modelo aumentará significativamente.
Paso 3: Invocación del modelo mediante la API de Nano Banana Pro
Nano Banana Pro utiliza el formato de interfaz nativo de Gemini, con el nombre de modelo gemini-3-pro-image-preview. Aquí tienes un ejemplo de invocación mínima, enviando la imagen plana en base64 junto con la indicación:
import requests, base64
API_URL = "https://api.apiyi.com/v1beta/models/gemini-3-pro-image-preview:generateContent"
headers = {"x-goog-api-key": "TU_CLAVE_API"}
with open("flat-lay-shirt.png", "rb") as f:
img_b64 = base64.b64encode(f.read()).decode()
payload = {
"contents": [{"parts": [
{"text": "Generate an image: A female model wearing the exact shirt from the reference image, preserving print and buttons. Studio lighting, full-body, e-commerce style."},
{"inline_data": {"mime_type": "image/png", "data": img_b64}}
]}],
"generationConfig": {"imageConfig": {"aspectRatio": "3:4", "imageSize": "2K"}}
}
resp = requests.post(API_URL, headers=headers, json=payload, timeout=300)
print(resp.status_code) # El inlineData devuelto es el base64 de la imagen generada
Dos parámetros a tener en cuenta: aspectRatio en 3:4 para adaptarse a las normas de las plataformas de comercio electrónico; imageSize en 2K es el equilibrio perfecto entre claridad y coste. Si necesitas 4K para recortes, el tiempo de procesamiento será mayor, así que ajusta el tiempo de espera (timeout) a 360 segundos.
🎯 Consejo de integración: Los canales oficiales de Nano Banana Pro (Vertex / AI Studio) pueden sufrir limitaciones de tráfico (503) en horas punta. Recomendamos acceder a través de APIYI (apiyi.com), que cuenta con redundancia multicanal y permite cambiar entre modelos como
gpt-image-2para comparar resultados, ahorrándote procesos de registro y vinculación de tarjetas en múltiples plataformas.
Paso 4: Verificación de fidelidad de detalles (imprescindible antes de publicar)
Si una imagen de modelo generada por IA puede publicarse depende de la consistencia entre los detalles de la prenda y el producto real. Cada imagen generada debe verificarse según esta lista:
| Punto de verificación | Qué revisar | Signos de fallo |
|---|---|---|
| Patrón de estampado | Posición, tamaño, integridad | Patrón "recreado" o desplazado |
| Fidelidad de color | Coincidencia con la imagen original | Desviación de color o saturación |
| Contorno de corte | Silueta, longitud, ajuste | Entallado convertido en recto, largo cambiado |
| Detalles | Cantidad de botones, cremalleras, bolsillos | Botones extra/faltantes, bolsillos desaparecidos |
| Realismo humano | Manos, rostro, proporciones | Dedos deformes, extremidades atravesando ropa |
Si la verificación falla, no es necesario regenerar toda la imagen. Nano Banana Pro admite edición mediante chat; simplemente añade una instrucción para corregir un área específica, por ejemplo: Keep everything unchanged, only restore the chest print to match the reference image exactly. Esto es más económico y evita alterar las partes que ya eran correctas.
Paso 5: Escalado por lotes para múltiples modelos y escenas
Una vez validado un modelo, puedes realizar una producción masiva. Mantén la indicación de bloqueo de la prenda y solo sustituye la descripción del modelo y la escena. Puedes generar toda una serie de materiales: una misma camisa en estudio, en la calle o en una cafetería, o generar modelos con diferentes perfiles étnicos para mercados globales.
El punto clave en la fase de lotes es controlar la concurrencia y los reintentos. La generación de Nano Banana Pro tarda entre diez segundos y un minuto; se recomienda usar una concurrencia de 5 a 10 tareas en cola y configurar un reintento automático. Si tu volumen es grande, consulta la documentación de optimización de lotes y concurrencia en el centro de ayuda de APIYI (help.apiyi.com), donde encontrarás scripts listos para usar.
Nano Banana Pro: Fidelidad en los detalles de las prendas y escritura avanzada de indicaciones
Tener un flujo de trabajo funcional es solo el punto de partida; lo que realmente marca la diferencia en la calidad de las imágenes es el control que ejerces sobre los detalles de la ropa mediante las indicaciones. Esta sección es una destilación de las conclusiones obtenidas tras probar 35 variantes de indicaciones en la comunidad internacional. La regla de oro es: primero el tejido, luego el estilo (fabric before style).

Los datos de las pruebas muestran que, cuando se especifica claramente el tipo de tejido en la indicación (por ejemplo: ribbed cotton, washed denim, silk satin), se obtienen resultados con texturas creíbles en 8 de cada 10 generaciones. Por el contrario, al usar términos genéricos como clothing o shirt, la tasa de éxito cae a solo 3 de cada 10. La razón es que las palabras que definen el tejido dictan directamente cómo el modelo renderiza el brillo, los pliegues y la caída: la seda debe tener un flujo brillante, el denim una textura de sarga y el tejido de punto una estructura acanalada; todo esto depende de una activación explícita en la indicación.
| Tipo de detalle | Escritura recomendada | Función |
|---|---|---|
| Textura del tejido | ribbed cotton knit / washed denim / silk satin |
Activa el renderizado correcto de brillo y pliegues |
| Bloqueo de estampado | preserving the original print pattern exactly |
Evita que el patrón sea reinterpretado |
| Bloqueo de accesorios | keep all buttons, zippers and stitching unchanged |
Evita la adición/eliminación de botones o desaparición de costuras |
| Anclaje de color | the exact same color as the reference image |
Suprime la deriva de color |
| Atmósfera de luz | soft daylight / golden hour backlighting |
Controla la iluminación mediante términos fotográficos |
Otro truco frecuente es «asignar roles» a las imágenes de referencia. Cuando subas varias imágenes a la vez (por ejemplo, una imagen plana + referencia de pose + referencia de fondo), explica el uso de cada una en la indicación: Image 1 is the garment source, image 2 is the pose reference, image 3 is the background. Nano Banana Pro entiende muy bien los roles de las imágenes múltiples; una vez definida la tarea, la tasa de errores por mezcla de imágenes disminuye drásticamente.
📘 Referencia para la selección del modelo: Si tus imágenes de ropa son principalmente modelos básicos de colores sólidos, Nano Banana 2 (versión estándar) es más barato, rápido y ofrece una mejor relación calidad-precio. Reserva el modelo Pro para prendas con estampados complejos o muchos detalles. Puedes alternar entre ambos modelos usando la misma clave API en la plataforma APIYI (apiyi.com); te recomiendo generar 10 imágenes con cada uno para comparar antes de decidir cuál será tu modelo principal.
Puntos críticos y soluciones al convertir imágenes planas a imágenes con modelo
Incluso con indicaciones bien redactadas, la categoría de ropa presenta algunos problemas frecuentes. Conocer las soluciones de antemano te ahorrará mucho tiempo y costes de regeneración.
| Fenómeno de error | Causa raíz | Solución |
|---|---|---|
| Deformación del corte (entallado a recto) | La imagen plana no expresa el corte tridimensional | Usa una foto de la prenda colgada como fuente o añade descripciones de silueta como slim-fit waist |
| Deriva de color | La descripción de la luz tiene matices cálidos/fríos | Añade exact same color y cambia la luz a neutral studio lighting |
| Estampado redibujado | No se bloqueó explícitamente el patrón | Añade preserving the print exactly y mantén el área del estampado en alta resolución en la fuente |
| Detalles traseros inventados | La fuente solo tiene información frontal | Debes proporcionar una imagen plana de la parte trasera; no dejes que el modelo adivine |
| Deformación de manos/rostro | Dificultad inherente a la generación de personas | Cambia la pose a manos en los bolsillos, sosteniendo un bolso, etc., o edita por zonas |
| Bloqueo de seguridad | Instrucciones de cambio de ropa con lenguaje sensible | Usa descripciones positivas como wearing the garment from the reference, evitando términos como swap o replace |
Un apunte especial sobre la deriva de color: es la principal causa de quejas en la generación de ropa con IA, ya que la diferencia de color está directamente relacionada con la tasa de devoluciones. Además del anclaje en la indicación, lo más fiable es comparar el valor de color de la imagen generada con la fuente en la misma pantalla. Si la desviación del color principal (HEX) es evidente, regenera directamente; no intentes corregir el color en postproducción, ya que esto alterará también el tono de piel del modelo.
En escenarios de producción masiva, te sugiero crear una "biblioteca de planes de contingencia" con las instrucciones de reparación anteriores. Si un ítem no pasa el control de calidad, añade automáticamente la indicación de reparación correspondiente para realizar ediciones por rondas. Este mecanismo, combinado con los canales de alta concurrencia de APIYI (apiyi.com), puede reducir el tiempo de procesamiento de una prenda (desde la imagen plana hasta la imagen completa con modelo) a menos de 10 minutos.
Preguntas frecuentes
Q1: Para convertir fotos de prendas planas a fotos con modelo, ¿cómo elijo entre Nano Banana Pro y gpt-image-2?
Nano Banana Pro es superior en la restauración de detalles finos como texturas de tela y bordados, además de admitir edición y reparación en múltiples rondas, lo que lo hace ideal para estilos con estampados complejos. Por otro lado, gpt-image-2 destaca en la composición con sentido del diseño y el renderizado de texto, siendo perfecto para escenarios que requieren una presentación tipo póster. Te recomendamos probar 10 imágenes de cada uno usando el mismo conjunto de origen en APIYI (apiyi.com) y decidir cuál será tu modelo principal según tu categoría de producto.
Q2: ¿Se pueden subir directamente a plataformas de comercio electrónico las imágenes de modelos generadas por IA?
Técnicamente sí, pero ten en cuenta dos puntos: primero, algunas plataformas exigen etiquetar el contenido generado por IA, así que verifica las políticas más recientes de tu plataforma antes de publicar. Segundo, la imagen debe reflejar fielmente el producto; si el estampado o el color no coinciden con el artículo real, esto podría generar devoluciones y quejas. Asegúrate de completar la lista de verificación de detalles del paso 4.
Q3: ¿Cuántas imágenes de modelos con prendas puestas se pueden obtener como máximo a partir de una sola foto plana?
En la práctica, una imagen de origen adecuada suele producir de forma estable entre 20 y 50 variantes aprobadas (combinando diferentes modelos, poses y escenarios). Si sigues generando más, notarás una homogeneización evidente y el valor marginal disminuirá. Para el mismo modelo en diferentes colores, recomendamos proporcionar una imagen de origen independiente para cada color; no intentes cambiar el color mediante la indicación, ya que el riesgo de discrepancia cromática es alto.
Q4: ¿Qué hago si encuentro errores 503 o fallos de generación durante la invocación?
Los canales oficiales de Nano Banana Pro pueden presentar limitaciones de tráfico (error 503) durante las horas pico. Para tareas por lotes, recomendamos implementar lógica de reintento automático y degradación (por ejemplo, cambiar a Nano Banana 2 si falla). Al realizar la invocación a través de APIYI (apiyi.com), la plataforma ya cuenta con redundancia multicanal, lo que reduce significativamente la tasa de fallos. Si experimentas problemas de estabilidad, puedes contactar directamente al soporte técnico para una revisión.
Conclusión
La conversión de fotos planas a fotos con modelos es actualmente el escenario de generación de imágenes con mayor retorno de inversión en el comercio electrónico de moda: el material de origen tiene un costo casi nulo (cada SKU ya requiere fotos planas) y las imágenes de modelos generadas por IA sustituyen directamente a las costosas sesiones fotográficas con personas reales. El flujo de trabajo de 5 pasos presentado en este artículo —preparación de material, indicación de cinco elementos, invocación del modelo, validación de detalles y expansión por lotes—, junto con el principio de "primero la tela, luego el estilo" y los planes de contingencia ante los seis errores más comunes, es suficiente para respaldar una línea de producción escalable, desde pruebas de un solo modelo hasta cientos de imágenes diarias.
La industria se encuentra en una ventana inicial de transición de la fotografía real a la IA. Migrar primero las páginas de detalles y las imágenes de escenario al flujo de trabajo de IA, y luego ampliar el alcance una vez validados los datos, es actualmente la ruta más segura. Si estás listo para comenzar las pruebas, puedes registrarte en APIYI (apiyi.com) para obtener créditos de prueba, ejecutar tu primera foto plana con la plantilla de código de este artículo y, posteriormente, añadir capacidades de procesamiento por lotes.
Autor: Equipo de APIYI
Soporte técnico: Los modelos mencionados en este artículo, como Nano Banana Pro y gpt-image-2, pueden ser invocados a través de la interfaz unificada de APIYI (apiyi.com). Los nuevos usuarios pueden registrarse para obtener créditos de prueba gratuitos.
