Guía completa para integrar gpt-image-2 en ComfyUI: 5 pasos para desbloquear el modelo de generación de imágenes más potente de OpenAI

¿Quieres invocar gpt-image-2 directamente en tu ComfyUI local para realizar generación de imágenes, retoques de máscara y composición multimagen, pero te frenan las restricciones de red, las cuotas y el control de parámetros de los nodos oficiales de OpenAI? Este artículo te mostrará la ruta más corta para completar todo el proceso: instalar un plugin de la comunidad, cambiar de servicio proxy de API y activar el nodo gpt-image-2 en tu lienzo de ComfyUI en 5 minutos.

gpt-image-2 es el modelo de imagen de "razonamiento antes de la generación" lanzado por OpenAI en 2026. Destaca en la composición de texto denso, infografías de interfaz de usuario, guiones gráficos de cómics y edición precisa con máscara, manteniendo la estabilidad de los píxeles en las áreas no editadas. Sin embargo, para integrarlo en los nodos de ComfyUI, los nodos oficiales de socios no son muy amigables para usuarios de muchas regiones: o pasas por Comfy Cloud o te quedas atascado en la fase de autenticación.

Comfyui-Luck-gpt2.0 es actualmente la solución de acceso a gpt-image-2 más estable en la comunidad de ComfyUI. Ofrece nodos de "control preciso" y "lotes económicos" en un solo paquete, permitiendo tanto salidas de alta calidad en 4K como lotes de borradores a $0.03 por imagen. El backend solo necesita conectarse a un servicio proxy de API compatible con la interfaz de OpenAI para funcionar. En este artículo recomendamos usar APIYI apiyi.com, que ofrece tres rutas: api.apiyi.com, vip.apiyi.com y b.apiyi.com, con soporte para Bearer Token listo para usar.

Al terminar este tutorial sobre cómo conectar gpt-image-2 en ComfyUI, obtendrás:

Un nodo Luck gpt-image-2 / Luck gpt-2.0 all que puedes buscar haciendo doble clic en el lienzo de ComfyUI.
Una guía rápida de parámetros que cubre 1K/2K/4K, 15 relaciones de aspecto y retoque de máscara.
Dos ejemplos de flujos de trabajo listos para usar (generación de texto a imagen en 4K + repintado local con máscara).
Una lista de verificación de errores comunes para evitar problemas de tiempo de espera, 429 y formatos de máscara.

1. ¿Por qué conectar gpt-image-2 en ComfyUI?

1.1 Tres nuevas capacidades que gpt-image-2 aporta a ComfyUI

Antes de gpt-image-2, crear carteles de texto e infografías de interfaz en el lienzo de ComfyUI dependía básicamente de combinar SDXL + ControlNet, lo que a menudo resultaba en texto borroso y diseños deformados. gpt-image-2 es el primer modelo de imagen de OpenAI que "razona antes de generar"; planifica la composición antes de dibujar, adaptándose a escenarios de ComfyUI que requieren colaboración con otros nodos:

Capacidad	Solución local anterior	Después de conectar gpt-image-2
Renderizado de texto denso	Requiere retoque posterior con OCR	Generación directa de listas centradas de "7 elementos en 11pt Helvetica"
Repintado local con máscara	Inpaint a menudo destruye píxeles circundantes	"Estabilidad de píxeles" fuera del área de edición, sin dañar rostros ni alterar la composición
Consistencia de referencia	Ajuste complejo de parámetros en IPAdapter	Hasta 5 imágenes de referencia para mantener la consistencia de personajes/productos
Resolución ultra alta	Hires.fix con ajustes repetitivos	Soporte nativo para salida 1K/2K/4K de una sola vez

1.2 ¿Por qué elegir Comfyui-Luck-gpt2.0 en lugar de los nodos oficiales?

ComfyUI añadió oficialmente los nodos OpenAI GPT-Image a través de Partner Nodes en la versión v0.19.4, pero por defecto se conecta directamente a OpenAI, lo que a menudo causa bloqueos en el protocolo de enlace SSL o limitaciones de tasa 429 en entornos con red restringida. El valor de Comfyui-Luck-gpt2.0 radica en:

✅ Amigable con redes locales: Se conecta por defecto a un servicio proxy de API compatible con la interfaz de OpenAI, con el sitio principal api.apiyi.com + doble respaldo.
✅ Parámetros más completos: Expone parámetros más precisos que los nodos oficiales, como image_size, quality, output_compression y output_format.
✅ Combinación de doble nodo: Incluye tanto nodos de "control preciso" como nodos económicos de "pago por imagen".
✅ Indicación en chino: El nodo inverso tiene una comprensión semántica más estable para el chino.

💡 Sugerencia de servicio proxy: Este artículo utiliza APIYI apiyi.com como puerta de entrada para gpt-image-2. Admite tanto el formato de Responses API como el de Images API, lo que corresponde exactamente a los dos tipos de puntos finales de nodo de Comfyui-Luck-gpt2.0, ahorrando la necesidad de adaptaciones adicionales.

1.3 ¿Para quién es este tutorial?

Tu rol	Qué obtendrás de este tutorial
Usuario veterano de ComfyUI	Insertar un nodo de "portada/cartel" de alta calidad en flujos de trabajo existentes, evitando retoques de texto en Photoshop
Fotógrafo comercial AIGC	Retoque de máscara + múltiples imágenes de referencia para replicar la consistencia de productos/modelos
Creador de contenido/Blogger	Salida de portadas verticales 2:3 en 4K con un clic, reemplazando bancos de imágenes externos
Desarrollador	Usar ComfyUI como un shell local de Stable Diffusion para probar la integración de la API con gpt-image-2

二、Componentes clave para integrar gpt-image-2 en ComfyUI

2.1 Un vistazo al plugin Comfyui-Luck-gpt2.0

Comfyui-Luck-gpt2.0 es un paquete de nodos personalizados de código abierto para ComfyUI, disponible en el repositorio de GitHub github.com/luckdvr/Comfyui-Luck-gpt2.0. No es un nodo único, sino un "conjunto de herramientas": tras la instalación, registrará dos nodos independientes en el menú de ComfyUI:

Comfyui-Luck-gpt2.0
├── Luck gpt-image-2       # Nodo de avance: control preciso, parámetro de tamaño real
└── Luck gpt-2.0 all       # Nodo de retroceso: modo económico, puntos finales conmutables

Ambos nodos comparten la misma interfaz externa y requieren que proporciones:

Una base_url compatible con el protocolo de OpenAI (se recomienda APIYI api.apiyi.com)
Un token con formato Bearer TU_CLAVE_API
Una indicación de texto o entrada de imagen

2.2 Cómo elegir entre los dos nodos: una tabla comparativa

Esta es la tabla más importante de todo el artículo, asegúrate de entenderla antes de continuar:

Dimensión de comparación	Luck gpt-image-2 (Avance)	Luck gpt-2.0 all (Retroceso)
Modelo backend	`gpt-image-2`	`gpt-image-2-all`
Posicionamiento	Control preciso, alta calidad	Económico, por lotes, amigable con chino
Parámetro size	✅ Campo `size` real	❌ Solo sugerido mediante indicación
Niveles de resolución	AUTO / 1K / 2K / 4K / Personalizado	Tamaño predeterminado
Relación de aspecto	15 preajustes + WxH personalizado	Expresado mediante indicación
Inpainting de máscara	✅ Compatible	❌ No compatible
Cantidad de imágenes de referencia	Hasta 5	Hasta 5
Niveles de calidad	auto / low / medium / high	Fijo
Formato de salida	PNG / JPEG / WebP	PNG
Cambio de punto final	`images_api` fijo	`chat_completions` / `images_api` conmutable
Precio de referencia	Facturación por token	Aprox. $0.03/imagen
Escenarios ideales	Pósteres, portadas, fotografía comercial, retoque de máscara	Lotes de bocetos, borradores conceptuales, indicación en chino

2.3 Backend de API: Por qué recomendamos APIYI (apiyi.com)

Comfyui-Luck-gpt2.0 es, en esencia, un "cascarón vacío"; quien realmente realiza la invocación a gpt-image-2 es la pasarela que configures en base_url. Esta espera que la pasarela cumpla con dos requisitos:

Compatibilidad total con el protocolo de OpenAI: Rutas como /v1/images/generations, /v1/responses y /v1/chat/completions deben estar completas.
Enrutamiento nativo para gpt-image-2: Debe ser capaz de reconocer model=gpt-image-2 y model=gpt-image-2-all.

🎯 Recomendación de integración: Sugerimos integrar gpt-image-2 a través de la plataforma APIYI (apiyi.com). Esta plataforma admite tanto el modo de avance de gpt-image-2 como el modo de retroceso de gpt-image-2-all, utilizando una autenticación de Bearer Token unificada. Además, cuenta con conmutación automática entre el sitio principal api.apiyi.com y las líneas de respaldo vip.apiyi.com / b.apiyi.com, lo que reduce significativamente la tasa de fallos en ComfyUI causados por inestabilidades en una única salida.

Los escenarios de uso para los diferentes dominios son los siguientes:

Dominio	Posicionamiento	Escenarios de uso
`api.apiyi.com`	Sitio principal	Predeterminado, uso diario en estaciones de trabajo ComfyUI
`vip.apiyi.com`	Línea de alta concurrencia	Generación por lotes, nodos múltiples en paralelo, colas nocturnas
`b.apiyi.com`	Salida de respaldo	Fallback automático ante fluctuaciones del sitio principal

Las tres líneas comparten el mismo conjunto de API Key, por lo que solo necesitas cambiar una cadena de texto en el nodo Comfyui-Luck-gpt2.0 para alternar entre ellas.

III. Pasos completos para la instalación de la integración de gpt-image-2 en ComfyUI

3.1 Verificación del entorno previo

Antes de empezar, asegúrate de que tu entorno de ComfyUI cumpla con lo siguiente:

Ítem	Requisito	Comando de verificación
Versión de ComfyUI	Se recomienda v0.3+ o superior	Primera línea en la consola al iniciar
Versión de Python	3.10 / 3.11 / 3.12	`python3 --version`
Git disponible	Se puede invocar directamente en la terminal	`git --version`
Espacio en disco	≥ 500 MB (plugin + dependencias)	`df -h`
Red	Acceso a GitHub + `api.apiyi.com`	`curl -I api.apiyi.com`

⚠️ Problema común: Si eres usuario de Windows y utilizas un paquete de instalación "todo en uno" (como la versión de QiuYe), python3 podría apuntar al Python integrado en el paquete; deberás usar .\python_embeded\python.exe en su lugar.

3.2 Instalación del plugin: 4 pasos

La instalación del plugin para la integración de gpt-image-2 en ComfyUI solo requiere 4 comandos. Abre la terminal, dirígete al directorio raíz de tu ComfyUI y ejecuta:

# 1. Entrar al directorio custom_nodes
cd ComfyUI/custom_nodes

# 2. Clonar el repositorio Comfyui-Luck-gpt2.0
git clone https://github.com/luckdvr/Comfyui-Luck-gpt2.0.git

# 3. Instalar dependencias de Python
cd Comfyui-Luck-gpt2.0
python3 -m pip install -r requirements.txt

# 4. Reiniciar ComfyUI

Los usuarios de paquetes integrados en Windows deben reemplazar el paso 3 por:

cd Comfyui-Luck-gpt2.0
..\..\python_embeded\python.exe -m pip install -r requirements.txt

Tras reiniciar, observa si en la consola aparecen registros similares a estos:

[Comfyui-Luck-gpt2.0] Registered node: Luck gpt-image-2
[Comfyui-Luck-gpt2.0] Registered node: Luck gpt-2.0 all

Si ves estas dos líneas de registro exitoso, significa que la parte de la integración de gpt-image-2 en ComfyUI está lista.

3.3 Obtener la clave API de APIYI

Abre tu navegador y visita el sitio oficial de APIYI apiyi.com.
Regístrate/inicia sesión y entra al panel de control → API Keys.
Haz clic en "Crear nueva clave". Se recomienda activar el "límite de cuota" y establecer un presupuesto inicial de ¥20–50 para verificar.
Copia la cadena de la clave que comienza con sk- y guárdala de forma segura.

🔐 Consejo de seguridad: Crea una clave nueva específicamente para ComfyUI y establece un límite de uso diario. El plugin local guardará la clave en los parámetros del nodo, lo que podría exponerla al exportar el JSON del flujo de trabajo; una clave independiente es más fácil de revocar si es necesario.

3.4 Insertar nodos en el lienzo de ComfyUI

Una vez abierto ComfyUI:

Haz doble clic en un espacio vacío del lienzo para abrir el buscador de nodos.
Escribe Luck gpt-image-2 (para conversión directa) o Luck gpt-2.0 all (para conversión inversa).
Selecciona el nodo y ComfyUI lo colocará donde esté tu cursor.

Cuando aparezca el nodo, rellena los tres campos clave:

Campo	Valor	Descripción
`base_url`	`https://api.apiyi.com/v1`	Dirección del sitio principal (asegúrate de incluir `/v1`)
`api_key`	`sk-xxxxxxxxxxxxxxxx`	Copiada desde el panel de APIYI
`model`	`gpt-image-2` o `gpt-image-2-all`	Depende del nodo, generalmente ya viene prellenado

3.5 Primera generación: flujo de trabajo mínimo ejecutable

Probemos con Luck gpt-image-2 una generación de texto a imagen sencilla de 1024×1024 para verificar que la conexión funciona:

[Luck gpt-image-2]
  ├── base_url     = https://api.apiyi.com/v1
  ├── api_key      = sk-xxxxxxxx
  ├── prompt       = Un póster de producto minimalista, fondo azul marino oscuro,
  │                  título centrado "HELLO 2026" en fuente Helvetica grande,
  │                  pequeñas estrellas dispersas alrededor
  ├── image_size   = 1K
  ├── aspect_ratio = 1:1
  ├── quality      = medium
  └── output_format = png
      │
      ▼
[Preview Image]

Conecta la salida image del nodo Luck gpt-image-2 al nodo Preview Image de ComfyUI y haz clic en "Queue". Después de unos 20–40 segundos, verás aparecer en el lado derecho del lienzo un póster cuadrado con el título "HELLO 2026". Si el texto es legible y está centrado, significa que has logrado con éxito la integración de gpt-image-2 en ComfyUI.

🎯 Confirmación de éxito: Si este paso falla, en el 90% de los casos es porque falta el /v1 en la base_url o porque no se añadió el prefijo sk- a la clave. Primero, vuelve al panel de APIYI (apiyi.com) para copiar y pegar la clave nuevamente, y luego verifica el final de la base_url.

IV. Guía rápida de parámetros clave para la integración de gpt-image-2 en ComfyUI

4.1 Resolución (image_size)

El campo image_size del nodo Luck gpt-image-2 determina la escala de resolución de salida:

image_size	Tamaño real (ejemplo 1:1)	Uso típico
AUTO	Determinado automáticamente por el modelo	Exploración sin restricciones de tamaño
1K	1024×1024	Bocetos, avatares, stickers
2K	2048×2048	Imágenes de cabecera, portadas de blog
4K	Hasta 3840×3840	Pósteres, impresiones, pantallas grandes
custom	ANCHOxALTO	Formatos publicitarios, imágenes alargadas

Requisitos para el modo custom:

El ancho y el alto deben ser múltiplos de 16.
El lado más largo no debe exceder los 3840 px.
Formato recomendado: 1600x900, 2048x1152, 1088x1920.

4.2 Relación de aspecto (aspect_ratio)

El nodo gpt-image-2 admite 15 relaciones de aspecto preestablecidas; aquí las 8 más utilizadas:

aspect_ratio	Escenario de uso
1:1	Avatares, imágenes cuadradas para redes sociales, fotos de producto
16:9	Cabeceras de blog, portadas de YouTube
9:16	Historias de Instagram/TikTok, fondos de pantalla móviles
2:3	Pósteres de cine, formato vertical estilo Pinterest
3:2	Fotografía profesional, proporción de cámara
4:3	Presentaciones, diapositivas PPT
21:9	Banners ultra anchos, cabeceras web horizontales
4:5	Proporción óptima para publicaciones en Instagram

Las otras 7 (como 7:4, 5:4, 3:4, etc.) se pueden activar según sea necesario. También puedes seleccionar custom y escribir manualmente WxH en custom_size para sobrescribir los ajustes preestablecidos.

4.3 Niveles de calidad (quality)

quality	Velocidad	Coste	Escenario de uso
auto	Medio	Medio	Dejar que el modelo decida
low	Rápido	Bajo	Bocetos rápidos, previsualización de atmósfera
medium	Medio	Medio	Imágenes para blogs, redes sociales
high	Lento	Alto	Portadas, pósteres, materiales de impresión

Regla de oro: Para relaciones de aspecto extremas (21:9) o alta resolución (4K), utiliza siempre quality=high, de lo contrario, los detalles serán insuficientes.

4.4 Formato de salida y compresión

output_format	output_compression	Uso
png	Ignorado	Fondos transparentes, post-procesamiento
jpeg	85–95	Imágenes para artículos de blog
webp	75–85	Sitios web, optimizado para móviles

output_compression solo es efectivo en los modos jpeg/webp, con valores de 0 a 100; a mayor número, mayor tamaño y mejor calidad.

4.5 Imágenes de referencia y Máscaras

Imágenes de referencia (reference images): Puedes conectar hasta 5 entradas IMAGE. El modelo las usará como anclas para la composición, estilo o personajes.
Máscara (Mask): Conecta una imagen en blanco y negro del mismo tamaño exacto que la primera imagen de referencia. Los píxeles blancos representan "editar aquí", mientras que los negros significan "mantener píxeles estables". Esta es una de las capacidades más potentes de gpt-image-2.

🎯 Consejo práctico: En ComfyUI, usa el nodo LoadImage para cargar la imagen original y luego usa MaskToImage / ImageInvert para construir la máscara. Si el flujo es complejo, consulta los flujos de trabajo de ejemplo de gpt-image-2 en la documentación oficial de APIYI docs.apiyi.com, que puedes copiar y pegar directamente con Ctrl+V.

V. Tres flujos de trabajo prácticos para integrar gpt-image-2 en ComfyUI

5.1 Flujo de trabajo A: Generación de pósteres 4K de alta calidad

Objetivo: Generar una portada con estilo de póster de película en 3840×5760 (2:3), con texto claro y una composición centrada.

[PrimitiveNode: cadena de indicación]
  │
  ▼
[Luck gpt-image-2]
  ├── base_url     = https://api.apiyi.com/v1
  ├── api_key      = sk-xxxx
  ├── prompt       = (desde el nodo superior)
  ├── image_size   = 4K
  ├── aspect_ratio = 2:3
  ├── quality      = high
  ├── output_format = png
  ├── timeout      = 360
  └── max_retries  = 3
      │
      ▼
[SaveImage: filename_prefix = poster_4k]

Ejemplo de indicación (prompt):

A cinematic poster for a sci-fi novel titled "NEON HORIZON",
dark blue and magenta gradient sky, lone silhouette standing on a cliff,
bold serif title centered at the top, subtle tagline at bottom in small caps,
highly detailed, 35mm film grain.

Puntos clave:

image_size=4K + aspect_ratio=2:3 ≈ 3840×5760.
quality=high es crucial para la nitidez del texto; en ajustes bajos, los glifos pueden aparecer distorsionados.
El timeout debe ser ≥ 360 segundos, ya que la generación en 4K puede tardar entre 3 y 5 minutos.

5.2 Flujo de trabajo B: Inpainting con máscara (cambio de fondo/ajuste de detalles)

Objetivo: Reemplazar el fondo blanco puro de una imagen de una taza de café por un "escritorio con textura de mármol", manteniendo intactos el objeto y las sombras.

[LoadImage: coffee_cup.png]      [LoadImage: coffee_cup_mask.png]
        │                                  │
        ▼                                  ▼
              [Luck gpt-image-2]
              ├── prompt     = Replace the background with a luxurious
              │                white marble countertop, soft natural
              │                window light from the left
              ├── image_1    = ← coffee_cup.png
              ├── mask       = ← coffee_cup_mask.png  (blanco=área de fondo)
              ├── image_size = 2K
              ├── quality    = high
                    │
                    ▼
              [SaveImage]

Reglas clave para la máscara (Mask):

La imagen de la máscara debe tener exactamente las mismas dimensiones (ancho y alto) que image_1.
Blanco (255,255,255) = Área que se desea editar.
Negro (0,0,0) = Área que debe mantenerse estable.
Gris intermedio = Mezcla proporcional (útil para suavizar bordes).

💡 Consejo de fidelidad: Aplica un desenfoque gaussiano de 3–5 px en los bordes de la máscara para evitar el efecto de "recorte pegado". gpt-image-2 maneja muy bien las transiciones en escala de grises, ideal para reemplazar fondos en fotografía de productos.

5.3 Flujo de trabajo C: Modo económico para 100 bocetos conceptuales

Objetivo: Diseñar 100 conceptos de ropa para un personaje, a un costo aproximado de $0.03 por imagen, manteniendo el total cerca de los $3.

[TextFileReader: 100 prompts]
          │
          ▼ (bucle/cola)
[Luck gpt-2.0 all]
  ├── base_url    = https://vip.apiyi.com/v1   ← usar ruta de alta concurrencia
  ├── api_key     = sk-xxxx
  ├── endpoint    = chat_completions
  ├── model       = gpt-image-2-all
  ├── timeout     = 180
  └── max_retries = 3
      │
      ▼
[SaveImage: filename_prefix = concept_###]

Tres razones por las que el nodo Luck gpt-2.0 all es ideal aquí:

Facturación por imagen: Aproximadamente $0.03 por imagen, más fácil de presupuestar que los nodos basados en tokens.
Compatible con indicaciones en chino: Útil para conceptos como "Hanfu reformado" o "Cyberpunk", con mayor estabilidad.
Cambio de endpoint: El modo chat_completions tiene mejor tolerancia para indicaciones largas.

🎯 Estabilidad en lotes: Al procesar por lotes, cambia la base_url a vip.apiyi.com, establece max_retries en 3 y timeout en 180 segundos. La ruta VIP de APIYI (apiyi.com) gestiona automáticamente las fluctuaciones temporales de errores 429/5xx redistribuyendo la carga, evitando que las tareas largas se bloqueen.

VI. Funciones avanzadas de gpt-image-2 en ComfyUI

6.1 Pipeline híbrido: gpt-image-2 para estructura + modelo local para estilo

gpt-image-2 destaca en "composición compleja + tipografía", pero se queda atrás frente a SDXL/Flux en estilos específicos como anime, pixel art o ilustradores concretos. Pipeline recomendado:

[Luck gpt-image-2]  → Generar composición principal (con texto y logo)
        ↓
[VAE Encode]        → Convertir a espacio latente
        ↓
[KSampler: Flux/SDXL + LoRA] → Transferencia de estilo / Refinamiento
        ↓
[Upscaler: 4x-UltraSharp] → Upscaling hasta 8K

Este enfoque combina la "habilidad de escritura" de gpt-image-2 con la "libertad de estilo" de los modelos locales, superando la calidad de usar un solo modelo.

6.2 Consistencia facial con múltiples imágenes de referencia

Utiliza las 5 entradas de imágenes de referencia de Luck gpt-image-2 para mejorar drásticamente la consistencia del personaje o producto:

Posición de referencia	Qué colocar
image_1	Imagen clara de frente
image_2	Vista lateral/trasera
image_3	Detalles (Logo, texturas)
image_4	Referencia de ambiente
image_5	Referencia de color/iluminación

En tu indicación, enfatiza "mantener la identidad del personaje de image_1" o "usar la dirección de luz de image_4" para resultados muy estables.

6.3 Consistencia en lotes: Generación de 8 imágenes en serie

gpt-image-2 puede devolver hasta 8 imágenes manteniendo la consistencia del sujeto en una sola solicitud. En el nodo Luck gpt-image-2, configura el parámetro n en 8 (a veces llamado batch_size):

Luck gpt-image-2
  ├── prompt = character turnaround sheet of a cyberpunk girl,
  │            8 different poses, same outfit, same face,
  │            white background, character sheet layout
  └── n = 8

Ideal para:

Hojas de rotación de personajes (8 ángulos).
Variantes de productos (8 colores/empaques).
Storyboards (8 viñetas).

6.4 Exponer el flujo de trabajo de ComfyUI como API

Si usas ComfyUI como "servidor privado" para un frontend, la salida del nodo Comfyui-Luck-gpt2.0 puede ser consumida directamente por la interfaz /prompt de ComfyUI. Utilizando las rutas de APIYI (apiyi.com) como backend, el flujo sería:

Tu frontend → ComfyUI HTTP API → Nodo Luck gpt-image-2 
                                      ↓
                          api.apiyi.com / vip.apiyi.com
                                      ↓
                               OpenAI gpt-image-2

Esta es la forma más rápida de empaquetar un "flujo de trabajo de ComfyUI" como una "API de imágenes externa".

VII. Preguntas frecuentes (FAQ) sobre la integración de gpt-image-2 en ComfyUI

P1: Ya instalé el nodo, pero no aparece `Luck gpt-image-2` en el lienzo.

Verifica estos cuatro puntos:

Comprueba si existe el directorio ComfyUI/custom_nodes/Comfyui-Luck-gpt2.0/.
Asegúrate de que todas las dependencias en requirements.txt se hayan instalado correctamente (presta atención a requests y Pillow).
Revisa la consola de ComfyUI al iniciar para ver si hay errores de ImportError en rojo.
Confirma si realmente "reiniciaste por completo" ComfyUI (recargar la página con Ctrl+R no cuenta).

P2: ¿Aparece el error `401 Unauthorized` o `Invalid API key`?

El 99% de las veces es un problema con la clave o la base_url:

La clave debe incluir obligatoriamente el prefijo sk-.
La base_url debe terminar en /v1 (no basta con poner https://api.apiyi.com).
No añadas manualmente Bearer antes de la clave; el nodo lo concatena automáticamente.

P3: ¿Aparece el error `429 Too Many Requests`?

Has alcanzado el límite de velocidad. Aquí tienes dos soluciones:

A corto plazo: Ajusta max_retries a más de 3 para que el nodo espere y reintente automáticamente.
A largo plazo: Cambia la base_url de api.apiyi.com a vip.apiyi.com o b.apiyi.com. Estas últimas son líneas de alta concurrencia o de respaldo.

Consulta rápida de códigos de error:

Código	Significado	Acción
401	Clave inválida	Copia de nuevo, verifica el prefijo `sk-`
403	Permisos insuficientes	Confirma en el panel de APIYI que el modelo esté activo
408	Tiempo de espera agotado	Ajusta el `timeout` a 360 segundos
429	Límite de velocidad	Cambia a la línea VIP + aumenta los reintentos
500/502	Inestabilidad del servidor	Reintento automático 3 veces o cambia a la línea B

P4: ¿La generación de imágenes 4K siempre agota el tiempo de espera?

Ajusta el timeout a 480 segundos (gpt-image-2 en 4K + quality=high a veces tarda hasta 6 minutos).
Con max_retries=2 es suficiente; demasiados reintentos acumulan mucho tiempo.
Si la red es lenta, prioriza image_size=2K y luego usa un nodo de escalado (Upscaler) para llegar a 4K; la sensación de velocidad será mayor.

P5: ¿La máscara no encaja bien al aplicarla?

Asegúrate de que la máscara y la imagen original tengan el mismo ancho y alto, sin desplazamiento de píxeles.
Confirma que la máscara sea puramente blanco y negro, sin canal alfa (transparencia).
Las áreas blancas deben ser totalmente (255,255,255), evita los tonos grisáceos.
Puedes añadir un nodo ImageThreshold antes del nodo de máscara para forzar la binarización.

P6: ¿Se puede usar totalmente sin conexión?

No. gpt-image-2 es un modelo en la nube de OpenAI y debe accederse a través de una pasarela. Sin embargo, puedes lograr una "pseudo-alta disponibilidad" usando las tres rutas de salida de APIYI (apiyi.com): si el sitio principal fluctúa, cambiará automáticamente, ofreciendo una experiencia cercana a una implementación local.

P7: ¿El texto en los prompts en chino sale distorsionado?

El nodo de flujo directo (Luck gpt-image-2) es más potente con la tipografía en inglés.
Para prompts en chino, se recomienda usar el nodo de flujo inverso (Luck gpt-2.0 all), que utiliza gpt-image-2-all, el cual tiene una comprensión más estable del chino.
Si debes usar el flujo directo con chino, escribe directamente en el prompt render Chinese text "你好世界" en lugar de dejar que el modelo "adivine" qué escribir.

P8: ¿Cómo estimar los costos?

Nodo de flujo directo (gpt-image-2): Se factura por token. Una imagen 2K cuesta aproximadamente $0.08–0.15, y una 4K high entre $0.25–0.40.
Nodo de flujo inverso (gpt-image-2-all): Se factura por imagen, aproximadamente $0.03/imagen.
Se recomienda activar el "límite de consumo diario" en el panel de APIYI (apiyi.com) y ejecutar primero 50–100 imágenes para establecer una base.

VIII. Conclusión sobre la integración de gpt-image-2 en ComfyUI

Integrar gpt-image-2 en ComfyUI te permite tener modelos de nube de primer nivel y nodos locales precisos en un mismo lienzo. Al completar este proceso, habrás logrado:

✅ Instalar el plugin Comfyui-Luck-gpt2.0 y registrar los nuevos nodos.
✅ Obtener la clave en el panel de APIYI (apiyi.com) y configurar base_url / api_key.
✅ Ejecutar un flujo de trabajo básico de texto a imagen para verificar la conexión.
✅ Dominar las combinaciones de parámetros: 1K/2K/4K, 15 relaciones de aspecto, cuatro niveles de calidad y tres formatos (PNG/JPEG/WebP).
✅ Ejecutar al menos uno de los flujos de trabajo prácticos: texto a imagen 4K, repintado con máscara o modo económico por lotes.

El mayor valor de la integración de gpt-image-2 en ComfyUI es convertir el "modelo de imagen de primer nivel de OpenAI" en un nodo estándar dentro de tu lienzo. Ya no necesitas cambiar constantemente entre el navegador y las herramientas locales; todo el pipeline puede conectarse en un solo flujo: gpt-image-2 genera el sujeto → SDXL estiliza → Upscaler escala → SaveImage guarda.

🎯 Sugerencia para el siguiente paso: Te recomiendo solicitar una clave de prueba en la plataforma APIYI (apiyi.com) (puedes establecer un límite bajo), ejecutar tu primera imagen siguiendo el flujo de trabajo mínimo de la sección §3.5 y luego expandirte a los tres flujos prácticos de la sección §5. Si tienes problemas con los parámetros, consulta la tabla de la sección §4; para códigos de error, revisa el FAQ en la sección §7. Si necesitas archivos JSON de flujos de trabajo más complejos, consulta la sección de ecosistema ComfyUI en el sitio de documentación oficial docs.apiyi.com.

Con esto, ya tienes una solución completa y lista para producción de integración de gpt-image-2 en ComfyUI. ¡Disfruta creando en tu lienzo de ComfyUI!

Autor: Equipo técnico de APIYI
Recursos relacionados:

Repositorio del plugin: github.com/luckdvr/Comfyui-Luck-gpt2.0
Sitio web de APIYI: apiyi.com
Documentación de APIYI: docs.apiyi.com
Sitio principal de APIYI: api.apiyi.com (Respaldo: vip.apiyi.com / b.apiyi.com)