|

Guía completa de configuración para la integración de Nano Banana Pro y Sora-2 en ComfyUI: la solución de integración de API más sencilla

ComfyUI, como herramienta de generación de imágenes y vídeos de código abierto, se ha convertido en la plataforma preferida de los creadores de IA. Con el lanzamiento del modelo de imagen Nano Banana Pro por parte de Google y el modelo de vídeo Sora-2 de OpenAI, muchos usuarios se hacen una pregunta fundamental: ¿Se pueden conectar estos modelos de vanguardia a ComfyUI? ¿Cómo es la configuración más sencilla?

En este artículo responderemos a fondo a estas preguntas, ofreciendo soluciones de integración completas que van desde nodos oficiales hasta plataformas de API de terceros, ayudándote a aprovechar rápidamente la potencia de Nano Banana Pro y Sora-2 dentro de ComfyUI.

nano-banana-pro-sora-2-comfyui-integration-guide-es 图示


I. Tres formas de conectar la API de Nano Banana Pro a ComfyUI

Nano Banana Pro es el modelo insignia de generación de imágenes lanzado por Google DeepMind, con soporte para resolución 4K, renderizado de texto multilingüe y alta consistencia de personajes. Según la documentación oficial y las prácticas de la comunidad, existen principalmente tres formas de integrarlo en ComfyUI:

1.1 Nodos Partner Oficiales de ComfyUI (Recomendado para principiantes)

Esta es la forma más sencilla de integración, ya que no requiere instalar ningún plugin. El equipo oficial de ComfyUI ya ha integrado Nano Banana Pro como un nodo nativo de API.

Pasos a seguir:

# Paso 1: Actualizar ComfyUI a la versión nightly
cd ComfyUI
git pull origin main
python main.py

# Paso 2: En la interfaz de ComfyUI
# 1. Doble clic en el lienzo vacío
# 2. Buscar el nodo "Google Gemini Image"
# 3. Arrastrarlo al flujo de trabajo

Parámetros de configuración del nodo:

Nombre del parámetro Obligatorio Descripción Valor de ejemplo
api_key Clave API de Google AI Studio AIzaSyC...
prompt Indicación de texto "A futuristic city at sunset"
mode Modo de generación generate / edit / style_transfer
resolution Resolución de salida 1024x1024 / 1280x720
aspect_ratio Relación de aspecto 16:9 / 4:3 / 1:1

Ventajas: Listo para usar, sin necesidad de configurar servidores o proxys.
Limitaciones: Requiere una clave API de Google AI Studio, que puede tener restricciones en ciertas regiones.

🎯 Sugerencia de configuración: Para usuarios individuales y pruebas a pequeña escala, recomendamos usar los Nodos Partner oficiales. Si necesitas un servicio de nivel empresarial más estable, puedes obtener una interfaz API de alta disponibilidad a través de la plataforma APIYI (apiyi.com). Esta plataforma utiliza el formato nativo de Google, permitiendo sustituir la API oficial sin modificar el código y reduciendo los costes en un 80%.

1.2 Nodos Personalizados – Custom Nodes (Para usuarios avanzados)

La comunidad de GitHub ofrece el nodo personalizado de código abierto ComfyUI-NanoBanano, que admite funciones más avanzadas.

Pasos de instalación:

# Entrar en el directorio de nodos personalizados de ComfyUI
cd ComfyUI/custom_nodes

# Clonar el repositorio
git clone https://github.com/ShmuelRonen/ComfyUI-NanoBanano.git

# Instalar dependencias
cd ComfyUI-NanoBanano
pip install -r requirements.txt

# Reiniciar ComfyUI

Modos de operación compatibles:

Modo Descripción de la función Escenario de uso
generate Generación de imagen a partir de texto Creación de imágenes nuevas desde cero
edit Edición y modificación de imágenes Modificaciones parciales de imágenes existentes
style_transfer Transferencia de estilo Aplicar el estilo de una imagen a otra
object_insertion Inserción de objetos Insertar nuevos elementos con precisión en la imagen

Ventajas: Más funcionalidades, soporte para operaciones multimodales.
Limitaciones: Requiere mantenimiento manual y actualización del plugin.

nano-banana-pro-sora-2-comfyui-integration-guide-es 图示

1.3 Plataforma de API de terceros (Solución empresarial)

Para empresas que requieren alta concurrencia, baja latencia y optimización de costes, las plataformas de API de terceros ofrecen una solución superior.

Comparativa de ventajas clave:

Dimensión API oficial de Google Plataforma de terceros (ej. APIYI)
Formato de API Nativo Google AI Studio Compatible con formato nativo Google
Migración de código Sin cambios Solo sustituir dos parámetros
Coste Precio estándar Reducción aprox. del 80%
Disponibilidad Depende de servidores Google Acceso local de alta velocidad, 99.9% SLA
Soporte técnico Soporte de comunidad Equipo técnico disponible 24/7

Ejemplo de configuración (basado en APIYI):

# Configuración original de Google
api_endpoint = "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-exp:generateImage"
api_key = "TU_GOOGLE_API_KEY"

# Cambio a la plataforma APIYI (solo estas dos líneas)
api_endpoint = "https://api.apiyi.com/v1/models/gemini-2.0-flash-exp:generateImage"
api_key = "TU_APIYI_API_KEY"  # Obtener en apiyi.com

🎯 Sugerencia empresarial: Si tu equipo necesita procesar tareas de generación de imágenes por lotes en ComfyUI, recomendamos integrar la API de Nano Banana Pro a través de APIYI (apiyi.com). La plataforma ofrece canales de aceleración dedicados y un modelo de pago por uso, ideal para entornos de producción que superan las 1000 imágenes diarias.


2. Integración del modelo de vídeo Sora-2 en ComfyUI: Análisis de viabilidad y configuración

Ante la pregunta clave de los usuarios "¿Es posible usar este modelo de vídeo en ComfyUI?", la respuesta es: Sí, pero es necesario hacerlo a través de nodos de API.

2.1 Principios técnicos de la integración de Sora-2 en ComfyUI

Sora-2 es la segunda generación del modelo de generación de vídeo de OpenAI. A diferencia de los modelos de imagen, Sora-2 no se puede desplegar de forma local como sucede con Stable Diffusion. Su integración en ComfyUI debe realizarse mediante una de estas dos vías:

Método de integración Implementación técnica Requisitos de recursos Viabilidad
Carga de modelo local Descargar archivos de pesos para ejecutar localmente VRAM de GPU > 80GB ❌ No factible (OpenAI no es de código abierto)
Llamada a nodos de API Llamar a una API remota mediante peticiones HTTP Solo conexión a internet y clave API ✅ Factible (Recomendado)
Alternativas Open Source Usar modelos como Open-Sora VRAM de GPU ≥ 16GB ✅ Factible (Funciones limitadas)

Conclusión: Sora-2 debe integrarse en ComfyUI obligatoriamente mediante nodos de API, ya que no admite el despliegue del modelo en local.

2.2 Tutorial de configuración de los nodos oficiales de la API de Sora-2

El equipo de ComfyUI ya ha lanzado los "Sora-2 Partner Nodes", que admiten tanto el modo de texto a vídeo (t2v) como el de imagen a vídeo (i2v).

Pasos de instalación:

# Paso 1: Asegúrate de que la versión de ComfyUI sea ≥ v0.2.6
cd ComfyUI
git pull origin main

# Paso 2: Añade el nodo de Sora-2 en tu flujo de trabajo
# 1. Haz doble clic en el lienzo vacío
# 2. Busca "OpenAI Sora" o "Sora-2-i2v"
# 3. Conecta los nodos de entrada (indicación de texto o imagen de referencia)

Configuración de parámetros del nodo Sora-2 Pro:

Nombre del parámetro Tipo de dato Descripción Valor recomendado
prompt String La indicación que describe el vídeo "A drone shot of a coastal city"
resolution Enum Resolución del vídeo 1280x720 / 720x1280
duration Integer Duración del vídeo (segundos) 5-20 segundos
input_image Image Imagen de referencia (modo i2v) Debe coincidir con la resolución
api_key String Clave API de OpenAI sk-proj-...

Notas importantes:

  • ⚠️ Coincidencia de resolución: En el modo de imagen a vídeo, la imagen de entrada debe coincidir exactamente con la resolución de vídeo seleccionada, de lo contrario dará error.
  • ⚠️ Control de costes: Sora-2 Pro factura por segundo; un vídeo de 20 segundos cuesta aproximadamente entre $0.50 y $1.00 USD.
  • ⚠️ Cuotas de API: OpenAI impone límites diarios a las cuentas nuevas; es necesario solicitar un aumento de cuota con antelación.

nano-banana-pro-sora-2-comfyui-integration-guide-es 图示

2.3 Nodos de API de Sora-2 de terceros (Solución Siray)

Además de los nodos oficiales, la comunidad ha proporcionado versiones mejoradas como los "Sora-2 Custom Nodes".

Características del nodo Sora-2-i2v de Siray OpenAI:

# Instalar nodos personalizados de Siray
cd ComfyUI/custom_nodes
git clone https://github.com/siray-comfyui/openai-sora-2.git
pip install -r openai-sora-2/requirements.txt

Funciones mejoradas:

Módulo de función Nodo oficial Nodo Siray Ventajas
Generación de vídeo por lotes Admite procesamiento automático de colas
Generación síncrona de audio Puede generar música de fondo simultáneamente
Barra de progreso Muestra el progreso de generación en tiempo real
Caché local Reduce llamadas repetitivas a la API

🎯 Recomendación de flujo de trabajo: Para equipos que necesitan generar grandes cantidades de vídeos de marketing, sugerimos combinar los nodos de preprocesamiento de ComfyUI con la API de Sora-2 para construir un flujo automatizado. A través de la plataforma APIYI (apiyi.com) se puede obtener un acceso más estable a la API de Sora-2, ideal para escenarios de generación masiva, ofreciendo gestión de colas dedicada y planes de optimización de costes.


3. Mejores prácticas para flujos de trabajo híbridos con Nano Banana Pro y Sora-2

La potencia de ComfyUI reside en su capacidad para encadenar múltiples modelos de IA en flujos de trabajo complejos. A continuación, presentamos un proceso típico de creación de imagen a video:

3.1 Diseño de la arquitectura del flujo de trabajo híbrido

Diagrama de flujo:

[Indicación de texto]
    ↓
[Nodo Nano Banana Pro] → Generar imagen de portada de alta calidad (4K)
    ↓
[Nodo de preprocesamiento de imagen] → Ajustar resolución a 1280x720
    ↓
[Nodo Sora-2 i2v] → Convertir imagen en video de 10 segundos
    ↓
[Nodo de postprocesamiento de video] → Añadir transiciones y efectos de sonido
    ↓
[Salida final] → Archivo de video MP4

Ejemplo de configuración de nodos:

Etapa del flujo de trabajo Modelo utilizado Parámetros clave Tiempo de procesamiento
1. Generación de imagen Nano Banana Pro resolution=3840x2160, mode=generate 8-15 segundos
2. Ajuste de resolución Integrado en ComfyUI target_size=1280x720, resize_mode=crop < 1 segundo
3. Generación de video Sora-2 Pro duration=10, motion_intensity=medium 60-120 segundos
4. Exportación de video Nodo FFmpeg codec=h264, bitrate=5000k 5-10 segundos

3.2 Ejemplos de código de flujo de trabajo real

JSON del flujo de trabajo de ComfyUI en versión simplificada (nodos centrales):

{
  "nodes": [
    {
      "id": 1,
      "type": "TextInput",
      "properties": {
        "text": "A cyberpunk city with neon lights and flying cars"
      }
    },
    {
      "id": 2,
      "type": "GoogleGeminiImage",
      "properties": {
        "api_key": "YOUR_API_KEY",
        "prompt": "@1.text",
        "resolution": "3840x2160"
      }
    },
    {
      "id": 3,
      "type": "ImageResize",
      "properties": {
        "input": "@2.output",
        "target_size": "1280x720"
      }
    },
    {
      "id": 4,
      "type": "OpenAISora2",
      "properties": {
        "api_key": "YOUR_OPENAI_KEY",
        "input_image": "@3.output",
        "duration": 10
      }
    }
  ]
}
Haz clic para expandir la configuración completa del flujo de trabajo (incluye parámetros avanzados)
{
  "version": "1.0",
  "workflow_name": "Nano_Banana_to_Sora2_Video",
  "nodes": [
    {
      "id": 1,
      "type": "TextInput",
      "properties": {
        "text": "A cyberpunk city with neon lights and flying cars",
        "negative_prompt": "blurry, low quality, distorted"
      }
    },
    {
      "id": 2,
      "type": "GoogleGeminiImage",
      "properties": {
        "api_key": "YOUR_API_KEY",
        "api_endpoint": "https://api.apiyi.com/v1/models/gemini-2.0-flash-exp:generateImage",
        "prompt": "@1.text",
        "negative_prompt": "@1.negative_prompt",
        "resolution": "3840x2160",
        "aspect_ratio": "16:9",
        "guidance_scale": 7.5,
        "num_inference_steps": 30
      }
    },
    {
      "id": 3,
      "type": "ImageResize",
      "properties": {
        "input": "@2.output",
        "target_size": "1280x720",
        "resize_mode": "crop_center",
        "interpolation": "lanczos"
      }
    },
    {
      "id": 4,
      "type": "OpenAISora2Pro",
      "properties": {
        "api_key": "YOUR_OPENAI_KEY",
        "input_image": "@3.output",
        "prompt": "@1.text",
        "duration": 10,
        "resolution": "1280x720",
        "motion_intensity": "medium",
        "camera_motion": "pan_right",
        "frame_rate": 30
      }
    },
    {
      "id": 5,
      "type": "VideoExport",
      "properties": {
        "input": "@4.output",
        "format": "mp4",
        "codec": "h264",
        "bitrate": "5000k",
        "output_path": "./outputs/final_video.mp4"
      }
    }
  ],
  "connections": [
    {"from": 1, "to": 2, "type": "text"},
    {"from": 2, "to": 3, "type": "image"},
    {"from": 3, "to": 4, "type": "image"},
    {"from": 4, "to": 5, "type": "video"}
  ]
}

🎯 Sugerencia de optimización de rendimiento: Al procesar tareas por lotes, se recomienda separar las llamadas a la API de Nano Banana Pro y Sora-2 en diferentes colas. Mediante la función de equilibrio de carga de la plataforma APIYI (apiyi.com), es posible procesar la generación de imágenes y videos en paralelo, mejorando la eficiencia general del flujo de trabajo en aproximadamente un 40%.


4. Preguntas frecuentes (FAQ)

Q1: ¿Pueden Nano Banana Pro y Sora-2 ejecutarse completamente de forma local?

Nano Banana Pro: ❌ No admite despliegue local; debe usarse mediante llamadas a la API.
Sora-2: ❌ No admite despliegue local; OpenAI no ha liberado los pesos del modelo como código abierto.
Alternativas: Se pueden utilizar Stable Diffusion (para imágenes) y Open-Sora (para video) para ejecución local.

Q2: ¿Cómo reducir los costos de las llamadas a la API de Sora-2?

Estrategia de optimización Reducción de costos Dificultad de implementación
Acortar la duración del video (10s → 5s) 50% ⭐ Fácil
Usar baja resolución (720p → 480p) 30% ⭐ Fácil
Llamadas por lotes para obtener descuentos 15-20% ⭐⭐ Media
Usar plataformas de API de terceros 20-40% ⭐⭐ Media

🎯 Sugerencia de gestión de costos: Para usuarios con un consumo mensual superior a $500 USD, recomendamos suscribirse a un plan empresarial a través de la plataforma APIYI (apiyi.com). La plataforma ofrece precios por niveles y descuentos por prepago, además de permitir la gestión unificada de facturación para Nano Banana Pro y Sora-2, simplificando los procesos financieros.

Q3: ¿Está limitada la resolución de los videos generados por Sora-2 en ComfyUI?

Sora-2 Versión Estándar:

  • ✅ Compatible: 720×1280, 1280×720
  • ❌ No compatible: 1080p, 4K

Sora-2 Versión Pro:

  • ✅ Compatible: 720×1280, 1280×720, 1024×1792, 1792×1024
  • ❌ No compatible: Resoluciones personalizadas

Solución: Utiliza nodos de superresolución de ComfyUI (como ESRGAN) para escalar el video de 720p a 1080p o 4K.

Q4: ¿Cómo pasar automáticamente la imagen generada por Nano Banana Pro a Sora-2?

En un flujo de trabajo de ComfyUI, es importante tener en cuenta los siguientes puntos clave:

# Ejemplo incorrecto: la conexión directa causará un desajuste de resolución
[Nano Banana Pro] → [Sora-2 i2v]  # ❌ Puede dar error

# Ejemplo correcto: añadir un nodo de redimensionamiento en medio
[Nano Banana Pro] → [Image Resize] → [Sora-2 i2v]  # ✅ Recomendado

Tabla de coincidencia de resolución:

Salida de Nano Banana Pro Requiere ajuste Requisitos de entrada de Sora-2
3840×2160 (4K) ✅ Resize (Redimensionar) 1280×720
1920×1080 (1080p) ✅ Crop+Resize (Recortar+Redimensionar) 1280×720
1280×720 (720p) ❌ Uso directo 1280×720

Q5: ¿Qué versiones de ComfyUI son compatibles con estos nuevos modelos?

Modelo Versión mínima de ComfyUI Versión recomendada Cómo obtenerla
Nano Banana Pro (Nodo oficial) v0.2.3 v0.2.7+ (nightly) git pull origin main
Sora-2 (Nodo oficial) v0.2.6 v0.2.8+ (nightly) Igual que arriba
Nodos personalizados Sin límite Última versión estable Instalar el complemento manualmente

5. Resumen y recomendaciones de selección

5.1 Respuestas a las preguntas principales

P: ¿Cuál es la configuración más sencilla para conectar la API de Nano Banana Pro a ComfyUI?
R: Utilizar los Partner Nodes oficiales. Solo requiere tres pasos:

  1. Actualizar ComfyUI a la versión nightly.
  2. Buscar y añadir el nodo "Google Gemini Image".
  3. Introducir tu clave de API y la indicación para empezar a generar.

P: ¿Se puede integrar el modelo de video Sora-2 en ComfyUI?
R: Sí, pero debe hacerse obligatoriamente mediante nodos de API. No admite despliegue en local. Tanto los desarrolladores oficiales como la comunidad ofrecen Custom Nodes ya listos para Sora-2.

5.2 Recomendaciones según el escenario de uso

Escenario de uso Solución recomendada Motivo
Aprendizaje y pruebas personales Partner Nodes oficiales Cuota gratuita y configuración sencilla.
Pequeños estudios (<100 imágenes/día) Custom Nodes + API oficial Funciones enriquecidas y costos controlables.
Entornos de producción empresarial Plataformas de API de terceros (como APIYI) Alta disponibilidad, optimización de costos y soporte técnico.
Despliegue privado offline Alternativas de código abierto (Stable Diffusion + Open-Sora) Seguridad de datos y sin dependencia de internet.

🎯 Recomendación final: Para los usuarios que necesiten utilizar Nano Banana Pro y Sora-2 simultáneamente, sugerimos gestionar las llamadas a la API de forma centralizada a través de la plataforma APIYI (apiyi.com). Esta plataforma permite acceder a ambos modelos con una sola API Key, simplifica la gestión de claves y ofrece un panel de monitoreo unificado junto con herramientas de análisis de costos. Visita apiyi.com ahora para registrar tu cuenta; los nuevos usuarios recibirán un crédito gratuito de $20 USD para probar sus flujos de trabajo.

5.3 Recursos de aprendizaje adicionales

Documentación oficial:

  • Documentación de ComfyUI: docs.comfy.org/tutorials/partner-nodes
  • Referencia de la API de Nano Banana Pro: ai.google.dev/gemini-api
  • Documentación de la API de Sora-2: platform.openai.com/docs/guides/sora

Recursos de la comunidad:

  • Compartir flujos de trabajo de ComfyUI: comfyui.org/workflows
  • Colección de nodos personalizados en GitHub: github.com/ComfyUI-Workflow/awesome-comfyui

Tutoriales en video:

  • "Tutorial completo de Nano Banana Pro en ComfyUI" – YouTube
  • "Demostración práctica de Sora-2 API Nodes" – Bilibili

Con la explicación detallada de este artículo, ya tienes el conocimiento necesario para integrar Nano Banana Pro y Sora-2 en ComfyUI. Ya sea que elijas la simplicidad de los nodos oficiales, la flexibilidad de los nodos personalizados o la robustez empresarial de una plataforma de terceros, puedes elegir la opción que mejor se adapte a tus necesidades reales.

¡Abre ComfyUI ahora mismo y comienza tu viaje creativo con IA!

Lecturas recomendadas:

  • Guía avanzada de ComfyUI: Construyendo flujos de trabajo automatizados para generación de video
  • Nano Banana Pro vs. Midjourney: Comparativa de modelos de generación de imágenes para empresas
  • Estrategias de optimización de costos en Sora-2 API: Cómo reducir los gastos de generación de video en un 70%

Publicaciones Similares