|

Guide de configuration complet pour l’intégration de Nano Banana Pro et Sora-2 à ComfyUI : la solution d’intégration d’API la plus simple

ComfyUI est devenu la plateforme de référence pour les créateurs d'IA en tant qu'outil open-source de génération d'images et de vidéos. Avec le lancement du modèle d'image Nano Banana Pro par Google et du modèle vidéo Sora-2 par OpenAI, beaucoup d'utilisateurs se posent une question cruciale : ces modèles de pointe peuvent-ils être intégrés à ComfyUI ? Et comment les configurer le plus simplement possible ?

Cet article répond en détail à ces deux questions en proposant des solutions d'intégration complètes, allant des nœuds officiels aux plateformes API tierces, pour vous aider à exploiter rapidement la puissance de Nano Banana Pro et Sora-2 dans ComfyUI.

nano-banana-pro-sora-2-comfyui-integration-guide-fr 图示


I. Trois solutions pour connecter l'API Nano Banana Pro à ComfyUI

Nano Banana Pro est le modèle de génération d'images phare de Google DeepMind. Il supporte la résolution 4K, le rendu de texte multilingue et une cohérence de personnage haute fidélité. Selon la documentation officielle et les retours de la communauté, il existe principalement trois façons de l'intégrer à ComfyUI :

1.1 Nœuds partenaires officiels ComfyUI (Recommandé pour les débutants)

C'est la méthode la plus simple, car elle ne nécessite l'installation d'aucun plugin. L'équipe de ComfyUI a déjà intégré Nano Banana Pro sous forme de nœud API natif.

Étapes à suivre :

# Étape 1 : Mettre à jour ComfyUI vers la version nightly
cd ComfyUI
git pull origin main
python main.py

# Étape 2 : Dans l'interface ComfyUI
# 1. Double-cliquez sur le canevas vide
# 2. Recherchez le nœud "Google Gemini Image"
# 3. Faites-le glisser dans votre workflow

Paramètres de configuration du nœud :

Nom du paramètre Requis Description Exemple
api_key Clé API Google AI Studio AIzaSyC...
prompt Invite textuelle "A futuristic city at sunset"
mode Mode de génération generate / edit / style_transfer
resolution Résolution de sortie 1024x1024 / 1280x720
aspect_ratio Ratio d'aspect 16:9 / 4:3 / 1:1

Avantages : Prêt à l'emploi, aucune configuration de serveur ou de proxy nécessaire.
Limites : Nécessite une clé API Google AI Studio, ce qui peut être restreint dans certaines régions.

🎯 Conseil de config : Pour les utilisateurs individuels et les tests à petite échelle, nous recommandons les nœuds partenaires officiels. Pour un service d'entreprise plus stable, vous pouvez passer par la plateforme APIYI (apiyi.com) pour obtenir des interfaces API haute disponibilité. Elle utilise le format natif de Google, permettant de remplacer l'API officielle sans modifier votre code, tout en réduisant les coûts de 80 %.

1.2 Nœuds personnalisés (Custom Nodes) (Pour les utilisateurs avancés)

La communauté GitHub propose des nœuds personnalisés open-source comme "ComfyUI-NanoBanano", offrant des fonctionnalités plus avancées.

Installation :

# Allez dans le répertoire des nœuds personnalisés de ComfyUI
cd ComfyUI/custom_nodes

# Clonez le dépôt
git clone https://github.com/ShmuelRonen/ComfyUI-NanoBanano.git

# Installez les dépendances
cd ComfyUI-NanoBanano
pip install -r requirements.txt

# Redémarrez ComfyUI

Modes d'opération supportés :

Mode Description Cas d'utilisation
generate Texte vers image Création d'une image entièrement nouvelle
edit Édition d'image Modification locale d'une image existante
style_transfer Transfert de style Application du style d'une image à une autre
object_insertion Insertion d'objet Insertion précise d'un nouvel élément dans l'image

Avantages : Plus de fonctionnalités, supporte les opérations multimodales.
Limites : Nécessite une maintenance manuelle et la mise à jour des plugins.

nano-banana-pro-sora-2-comfyui-integration-guide-fr 图示

1.3 Plateformes API tierces (Solution Entreprise)

Pour les entreprises nécessitant une haute concurrence, une faible latence et une optimisation des coûts, les plateformes API tierces offrent une meilleure alternative.

Comparaison des avantages clés :

Dimension API officielle Google Plateforme tierce (ex: APIYI)
Format API Natif Google AI Studio Compatible format natif Google
Migration Juste deux paramètres à changer
Coût Prix standard Réduction d'environ 80 %
Disponibilité Dépend des serveurs Google Accès local haute vitesse, SLA 99,9 %
Support Communauté Équipe technique 24h/24, 7j/7

Exemple de configuration (avec APIYI) :

# Configuration originale Google
api_endpoint = "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-exp:generateImage"
api_key = "VOTRE_CLÉ_API_GOOGLE"

# Passage à la plateforme APIYI (modifiez juste ces deux lignes)
api_endpoint = "https://api.apiyi.com/v1/models/gemini-2.0-flash-exp:generateImage"
api_key = "VOTRE_CLÉ_API_APIYI"  # À obtenir sur apiyi.com

🎯 Recommandation Entreprise : Si votre équipe doit traiter des volumes massifs de génération d'images dans ComfyUI, nous vous conseillons d'utiliser l'API Nano Banana Pro via APIYI (apiyi.com). Cette plateforme propose des canaux d'accélération dédiés et une facturation à l'usage, idéale pour les environnements de production dépassant les 1000 images par jour.


II. Intégration du modèle vidéo Sora-2 dans ComfyUI : Analyse de faisabilité et options de configuration

Pour répondre à la question centrale du client "Est-il possible d'utiliser ce modèle vidéo dans ComfyUI ?", la réponse est : Oui, mais cela nécessite de passer par un nœud API.

2.1 Principes techniques de l'intégration de Sora-2 dans ComfyUI

Sora-2 est le modèle de génération vidéo de deuxième génération lancé par OpenAI. Contrairement aux modèles d'image, Sora-2 ne peut pas être déployé localement comme Stable Diffusion. Son intégration dans ComfyUI doit passer par l'une des deux voies suivantes :

Méthode d'accès Implémentation technique Ressources requises Faisabilité
Chargement du modèle local Téléchargement des fichiers de poids pour exécution locale VRAM GPU > 80 Go ❌ Impossible (OpenAI n'est pas open source)
Appel par nœud API Appeler l'API distante via des requêtes HTTP Connexion Internet et clé API uniquement ✅ Possible (Recommandé officiellement)
Alternatives Open Source Utiliser des modèles comme Open-Sora VRAM GPU ≥ 16 Go ✅ Possible (Fonctionnalités limitées)

Conclusion : Sora-2 doit impérativement être intégré à ComfyUI via des nœuds API, le déploiement local n'est pas supporté.

2.2 Tutoriel de configuration des nœuds API Sora-2 officiels

L'équipe de ComfyUI a déjà publié les "Sora-2 Partner Nodes", qui supportent les modes Texte-vers-Vidéo et Image-vers-Vidéo.

Étapes d'installation :

# Étape 1 : Assurez-vous que la version de ComfyUI est ≥ v0.2.6
cd ComfyUI
git pull origin main

# Étape 2 : Ajoutez le nœud Sora-2 au workflow
# 1. Double-cliquez sur le canevas vide
# 2. Recherchez "OpenAI Sora" ou "Sora-2-i2v"
# 3. Connectez les nœuds d'entrée (invite de texte ou image de référence)

Configuration des paramètres du nœud Sora-2 Pro :

Paramètre Type de donnée Description Valeur recommandée
prompt String Invite de description vidéo "A drone shot of a coastal city"
resolution Enum Résolution vidéo 1280x720 / 720x1280
duration Integer Durée de la vidéo (secondes) 5-20 secondes
input_image Image Image de référence (mode i2v) Doit correspondre exactement à la résolution
api_key String Clé API OpenAI sk-proj-...

Notes importantes :

  • ⚠️ Correspondance de résolution : En mode Image-vers-Vidéo, l'image d'entrée doit correspondre exactement à la résolution vidéo sélectionnée, sinon une erreur se produira.
  • ⚠️ Contrôle des coûts : Sora-2 Pro est facturé à la seconde, une vidéo de 20 secondes coûte environ entre 0,50 $ et 1,00 $.
  • ⚠️ Quotas API : OpenAI impose des limites d'appels quotidiens aux nouveaux comptes, il est nécessaire de demander une augmentation de quota à l'avance.

nano-banana-pro-sora-2-comfyui-integration-guide-fr 图示

2.3 Nœuds API Sora-2 tiers (Solution Siray)

En plus des nœuds officiels, la communauté propose une version améliorée : les "Sora-2 Custom Nodes".

Caractéristiques du nœud Sora-2-i2v de Siray OpenAI :

# Installation des nœuds personnalisés de Siray
cd ComfyUI/custom_nodes
git clone https://github.com/siray-comfyui/openai-sora-2.git
pip install -r openai-sora-2/requirements.txt

Fonctionnalités améliorées :

Fonctionnalité Nœud officiel Nœud Siray Avantages
Génération par lots Supporte le traitement automatique des files d'attente
Synchro audio Permet de générer une musique de fond simultanément
Barre de progression Affiche l'état d'avancement en temps réel
Cache local Réduit les appels API redondants

🎯 Conseil de workflow : Pour les équipes qui doivent générer une grande quantité de vidéos marketing, nous recommandons de combiner les nœuds de prétraitement de ComfyUI avec l'API Sora-2 pour construire un workflow automatisé. Via la plateforme APIYI (apiyi.com), vous pouvez obtenir des accès API Sora-2 plus stables, particulièrement adaptés aux scénarios de génération de masse, avec une gestion de file d'attente dédiée et des options d'optimisation des coûts.


III. Meilleures pratiques pour le workflow hybride Nano Banana Pro et Sora-2

La force de ComfyUI réside dans sa capacité à enchaîner plusieurs modèles d'IA pour créer des workflows complexes. Voici un processus de création Image-vers-Vidéo typique :

3.1 Architecture du workflow hybride

Schéma de flux :

[Invite textuelle]
    ↓
[Nœud Nano Banana Pro] → Génère une image de couverture haute qualité (4K)
    ↓
[Nœud de prétraitement d'image] → Ajuste la résolution à 1280x720
    ↓
[Nœud Sora-2 i2v] → Transforme l'image en une vidéo de 10 secondes
    ↓
[Nœud de post-traitement vidéo] → Ajoute des transitions et des effets sonores
    ↓
[Sortie finale] → Fichier vidéo MP4

Exemple de configuration des nœuds :

Étape du workflow Modèle utilisé Paramètres clés Temps de traitement
1. Génération d'image Nano Banana Pro resolution=3840x2160, mode=generate 8-15 s
2. Ajustement résolution ComfyUI intégré target_size=1280x720, resize_mode=crop < 1 s
3. Génération vidéo Sora-2 Pro duration=10, motion_intensity=medium 60-120 s
4. Export vidéo Nœud FFmpeg codec=h264, bitrate=5000k 5-10 s

3.2 Exemple de code pour le workflow réel

Version minimaliste du JSON Workflow ComfyUI (nœuds de base) :

{
  "nodes": [
    {
      "id": 1,
      "type": "TextInput",
      "properties": {
        "text": "A cyberpunk city with neon lights and flying cars"
      }
    },
    {
      "id": 2,
      "type": "GoogleGeminiImage",
      "properties": {
        "api_key": "YOUR_API_KEY",
        "prompt": "@1.text",
        "resolution": "3840x2160"
      }
    },
    {
      "id": 3,
      "type": "ImageResize",
      "properties": {
        "input": "@2.output",
        "target_size": "1280x720"
      }
    },
    {
      "id": 4,
      "type": "OpenAISora2",
      "properties": {
        "api_key": "YOUR_OPENAI_KEY",
        "input_image": "@3.output",
        "duration": 10
      }
    }
  ]
}
Cliquez pour afficher la configuration complète du workflow (paramètres avancés)
{
  "version": "1.0",
  "workflow_name": "Nano_Banana_to_Sora2_Video",
  "nodes": [
    {
      "id": 1,
      "type": "TextInput",
      "properties": {
        "text": "A cyberpunk city with neon lights and flying cars",
        "negative_prompt": "blurry, low quality, distorted"
      }
    },
    {
      "id": 2,
      "type": "GoogleGeminiImage",
      "properties": {
        "api_key": "YOUR_API_KEY",
        "api_endpoint": "https://api.apiyi.com/v1/models/gemini-2.0-flash-exp:generateImage",
        "prompt": "@1.text",
        "negative_prompt": "@1.negative_prompt",
        "resolution": "3840x2160",
        "aspect_ratio": "16:9",
        "guidance_scale": 7.5,
        "num_inference_steps": 30
      }
    },
    {
      "id": 3,
      "type": "ImageResize",
      "properties": {
        "input": "@2.output",
        "target_size": "1280x720",
        "resize_mode": "crop_center",
        "interpolation": "lanczos"
      }
    },
    {
      "id": 4,
      "type": "OpenAISora2Pro",
      "properties": {
        "api_key": "YOUR_OPENAI_KEY",
        "input_image": "@3.output",
        "prompt": "@1.text",
        "duration": 10,
        "resolution": "1280x720",
        "motion_intensity": "medium",
        "camera_motion": "pan_right",
        "frame_rate": 30
      }
    },
    {
      "id": 5,
      "type": "VideoExport",
      "properties": {
        "input": "@4.output",
        "format": "mp4",
        "codec": "h264",
        "bitrate": "5000k",
        "output_path": "./outputs/final_video.mp4"
      }
    }
  ],
  "connections": [
    {"from": 1, "to": 2, "type": "text"},
    {"from": 2, "to": 3, "type": "image"},
    {"from": 3, "to": 4, "type": "image"},
    {"from": 4, "to": 5, "type": "video"}
  ]
}

🎯 Conseil d'optimisation des performances : Lors du traitement de tâches par lots, il est recommandé de séparer les appels API de Nano Banana Pro et de Sora-2 dans des files d'attente distinctes. Grâce aux fonctions d'équilibrage de charge de la plateforme APIYI (apiyi.com), vous pouvez traiter en parallèle la génération d'images et de vidéos, améliorant l'efficacité globale du workflow d'environ 40 %.


IV. Foire aux questions (FAQ)

Q1 : Nano Banana Pro et Sora-2 peuvent-ils fonctionner entièrement en local ?

Nano Banana Pro : ❌ Pas de support pour le déploiement local, passage obligatoire par des appels API.
Sora-2 : ❌ Pas de support pour le déploiement local, OpenAI n'a pas rendu publics les poids du modèle.
Alternative : Vous pouvez utiliser Stable Diffusion (image) et Open-Sora (vidéo) en open-source pour une exécution locale.

Q2 : Comment réduire les coûts d'appel à l'API Sora-2 ?

Stratégie d'optimisation Réduction des coûts Difficulté de mise en œuvre
Raccourcir la durée (10s → 5s) 50% ⭐ Facile
Utiliser une basse résolution (720p → 480p) 30% ⭐ Facile
Appels par lots pour obtenir des remises 15-20% ⭐⭐ Moyenne
Utiliser une plateforme API tierce 20-40% ⭐⭐ Moyenne

🎯 Conseil de gestion des coûts : Pour les utilisateurs dont la consommation mensuelle dépasse 500 $, nous recommandons de souscrire à un forfait entreprise via la plateforme APIYI (apiyi.com). La plateforme propose des tarifs dégressifs et des remises sur prépaiement, tout en centralisant la facturation pour Nano Banana Pro et Sora-2, ce qui simplifie vos processus financiers.

Q3 : La résolution des vidéos générées par Sora-2 dans ComfyUI est-elle limitée ?

Sora-2 Standard :

  • ✅ Supporté : 720×1280, 1280×720
  • ❌ Non supporté : 1080p, 4K

Sora-2 version Pro :

  • ✅ Supporté : 720×1280, 1280×720, 1024×1792, 1792×1024
  • ❌ Non supporté : Résolutions personnalisées

Solution : Utilisez les nœuds de super-résolution de ComfyUI (comme ESRGAN) pour upscaler une vidéo 720p en 1080p ou 4K.

Q4 : Comment transmettre automatiquement une image Nano Banana Pro à Sora-2 ?

Dans un workflow ComfyUI, vous devez faire attention au point suivant :

# Exemple d'erreur : Une connexion directe entraîne un conflit de résolution
[Nano Banana Pro] → [Sora-2 i2v]  # ❌ Erreur probable

# Exemple correct : Ajouter un nœud de conversion de résolution entre les deux
[Nano Banana Pro] → [Image Resize] → [Sora-2 i2v]  # ✅ Recommandé

Tableau de correspondance des résolutions :

Sortie Nano Banana Pro Ajustement nécessaire Exigence d'entrée Sora-2
3840×2160 (4K) ✅ Resize 1280×720
1920×1080 (1080p) ✅ Crop+Resize 1280×720
1280×720 (720p) ❌ Utilisation directe 1280×720

Q5 : Quelles versions de ComfyUI supportent ces nouveaux modèles ?

Modèle Version minimale ComfyUI Version recommandée Comment l'obtenir
Nano Banana Pro (nœud officiel) v0.2.3 v0.2.7+ (nightly) git pull origin main
Sora-2 (nœud officiel) v0.2.6 v0.2.8+ (nightly) Idem
Nœuds personnalisés Aucune restriction Dernière version stable Installation manuelle de l'extension

V. Résumé et conseils de sélection

5.1 Récapitulatif des questions clés

Q : Quelle est la configuration la plus simple pour intégrer l'API Nano Banana Pro dans ComfyUI ?
R : Utilisez les "Partner Nodes" officiels, cela ne prend que trois étapes :

  1. Mettre à jour ComfyUI vers la version "nightly".
  2. Rechercher et ajouter le nœud "Google Gemini Image".
  3. Saisir votre clé API et votre invite pour commencer.

Q : Le modèle vidéo Sora-2 peut-il être intégré à ComfyUI ?
R : Oui, mais cela doit impérativement se faire via un nœud API. Le déploiement local n'est pas supporté. Des "Custom Nodes" pour Sora-2 sont disponibles via les canaux officiels et tiers.

5.2 Conseils de sélection selon les scénarios

Scénario d'utilisation Solution recommandée Raison
Apprentissage et tests personnels Partner Nodes officiels Quota gratuit, configuration simple
Petit studio (<100 images/jour) Custom Nodes + API officielle Fonctionnalités riches, coûts maîtrisés
Environnement de production en entreprise Plateforme API tierce (ex: APIYI) Haute disponibilité, optimisation des coûts, support technique
Déploiement privé hors ligne Alternatives Open Source (Stable Diffusion + Open-Sora) Sécurité des données, aucune dépendance réseau

🎯 Conseil final : Pour les utilisateurs ayant besoin d'utiliser simultanément Nano Banana Pro et Sora-2, nous recommandons de centraliser vos appels API via la plateforme APIYI (apiyi.com). Cette plateforme permet d'accéder aux deux modèles avec une seule clé API, simplifiant ainsi la gestion des clés tout en offrant un panneau de contrôle unifié et des outils d'analyse de coûts. Rendez-vous dès maintenant sur apiyi.com pour créer un compte ; les nouveaux utilisateurs reçoivent un crédit gratuit de 20 $ pour tester leurs flux de travail.

5.3 Ressources d'apprentissage complémentaires

Documentation officielle :

  • Documentation officielle de ComfyUI : docs.comfy.org/tutorials/partner-nodes
  • Référence API Nano Banana Pro : ai.google.dev/gemini-api
  • Documentation API Sora-2 : platform.openai.com/docs/guides/sora

Ressources communautaires :

  • Partage de workflows ComfyUI : comfyui.org/workflows
  • Collection de nœuds personnalisés sur GitHub : github.com/ComfyUI-Workflow/awesome-comfyui

Tutoriels vidéo :

  • "Tutoriel complet ComfyUI Nano Banana Pro" – YouTube
  • "Démonstration pratique des nœuds API Sora-2" – Bilibili

Grâce aux explications détaillées de cet article, vous maîtrisez désormais l'écosystème complet de l'intégration de Nano Banana Pro et Sora-2 dans ComfyUI. Que vous choisissiez la simplicité des nœuds officiels, la flexibilité des nœuds personnalisés ou la robustesse d'une plateforme tierce pour entreprise, vous pouvez désormais adapter votre configuration à vos besoins réels.

Lancez ComfyUI dès maintenant et commencez votre voyage créatif avec l'IA !

Lectures recommandées :

  • « Guide avancé ComfyUI : Construire un workflow d'automatisation de génération vidéo »
  • « Nano Banana Pro vs Midjourney : Comparatif des modèles de génération d'images pour les entreprises »
  • « Stratégies d'optimisation des coûts de l'API Sora-2 : Comment réduire les frais de génération vidéo de 70 % »

Publications similaires