ComfyUI est devenu la plateforme de référence pour les créateurs d'IA en tant qu'outil open-source de génération d'images et de vidéos. Avec le lancement du modèle d'image Nano Banana Pro par Google et du modèle vidéo Sora-2 par OpenAI, beaucoup d'utilisateurs se posent une question cruciale : ces modèles de pointe peuvent-ils être intégrés à ComfyUI ? Et comment les configurer le plus simplement possible ?
Cet article répond en détail à ces deux questions en proposant des solutions d'intégration complètes, allant des nœuds officiels aux plateformes API tierces, pour vous aider à exploiter rapidement la puissance de Nano Banana Pro et Sora-2 dans ComfyUI.

I. Trois solutions pour connecter l'API Nano Banana Pro à ComfyUI
Nano Banana Pro est le modèle de génération d'images phare de Google DeepMind. Il supporte la résolution 4K, le rendu de texte multilingue et une cohérence de personnage haute fidélité. Selon la documentation officielle et les retours de la communauté, il existe principalement trois façons de l'intégrer à ComfyUI :
1.1 Nœuds partenaires officiels ComfyUI (Recommandé pour les débutants)
C'est la méthode la plus simple, car elle ne nécessite l'installation d'aucun plugin. L'équipe de ComfyUI a déjà intégré Nano Banana Pro sous forme de nœud API natif.
Étapes à suivre :
# Étape 1 : Mettre à jour ComfyUI vers la version nightly
cd ComfyUI
git pull origin main
python main.py
# Étape 2 : Dans l'interface ComfyUI
# 1. Double-cliquez sur le canevas vide
# 2. Recherchez le nœud "Google Gemini Image"
# 3. Faites-le glisser dans votre workflow
Paramètres de configuration du nœud :
| Nom du paramètre | Requis | Description | Exemple |
|---|---|---|---|
api_key |
✅ | Clé API Google AI Studio | AIzaSyC... |
prompt |
✅ | Invite textuelle | "A futuristic city at sunset" |
mode |
✅ | Mode de génération | generate / edit / style_transfer |
resolution |
❌ | Résolution de sortie | 1024x1024 / 1280x720 |
aspect_ratio |
❌ | Ratio d'aspect | 16:9 / 4:3 / 1:1 |
Avantages : Prêt à l'emploi, aucune configuration de serveur ou de proxy nécessaire.
Limites : Nécessite une clé API Google AI Studio, ce qui peut être restreint dans certaines régions.
🎯 Conseil de config : Pour les utilisateurs individuels et les tests à petite échelle, nous recommandons les nœuds partenaires officiels. Pour un service d'entreprise plus stable, vous pouvez passer par la plateforme APIYI (apiyi.com) pour obtenir des interfaces API haute disponibilité. Elle utilise le format natif de Google, permettant de remplacer l'API officielle sans modifier votre code, tout en réduisant les coûts de 80 %.
1.2 Nœuds personnalisés (Custom Nodes) (Pour les utilisateurs avancés)
La communauté GitHub propose des nœuds personnalisés open-source comme "ComfyUI-NanoBanano", offrant des fonctionnalités plus avancées.
Installation :
# Allez dans le répertoire des nœuds personnalisés de ComfyUI
cd ComfyUI/custom_nodes
# Clonez le dépôt
git clone https://github.com/ShmuelRonen/ComfyUI-NanoBanano.git
# Installez les dépendances
cd ComfyUI-NanoBanano
pip install -r requirements.txt
# Redémarrez ComfyUI
Modes d'opération supportés :
| Mode | Description | Cas d'utilisation |
|---|---|---|
generate |
Texte vers image | Création d'une image entièrement nouvelle |
edit |
Édition d'image | Modification locale d'une image existante |
style_transfer |
Transfert de style | Application du style d'une image à une autre |
object_insertion |
Insertion d'objet | Insertion précise d'un nouvel élément dans l'image |
Avantages : Plus de fonctionnalités, supporte les opérations multimodales.
Limites : Nécessite une maintenance manuelle et la mise à jour des plugins.

1.3 Plateformes API tierces (Solution Entreprise)
Pour les entreprises nécessitant une haute concurrence, une faible latence et une optimisation des coûts, les plateformes API tierces offrent une meilleure alternative.
Comparaison des avantages clés :
| Dimension | API officielle Google | Plateforme tierce (ex: APIYI) |
|---|---|---|
| Format API | Natif Google AI Studio | Compatible format natif Google |
| Migration | – | Juste deux paramètres à changer |
| Coût | Prix standard | Réduction d'environ 80 % |
| Disponibilité | Dépend des serveurs Google | Accès local haute vitesse, SLA 99,9 % |
| Support | Communauté | Équipe technique 24h/24, 7j/7 |
Exemple de configuration (avec APIYI) :
# Configuration originale Google
api_endpoint = "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-exp:generateImage"
api_key = "VOTRE_CLÉ_API_GOOGLE"
# Passage à la plateforme APIYI (modifiez juste ces deux lignes)
api_endpoint = "https://api.apiyi.com/v1/models/gemini-2.0-flash-exp:generateImage"
api_key = "VOTRE_CLÉ_API_APIYI" # À obtenir sur apiyi.com
🎯 Recommandation Entreprise : Si votre équipe doit traiter des volumes massifs de génération d'images dans ComfyUI, nous vous conseillons d'utiliser l'API Nano Banana Pro via APIYI (apiyi.com). Cette plateforme propose des canaux d'accélération dédiés et une facturation à l'usage, idéale pour les environnements de production dépassant les 1000 images par jour.
II. Intégration du modèle vidéo Sora-2 dans ComfyUI : Analyse de faisabilité et options de configuration
Pour répondre à la question centrale du client "Est-il possible d'utiliser ce modèle vidéo dans ComfyUI ?", la réponse est : Oui, mais cela nécessite de passer par un nœud API.
2.1 Principes techniques de l'intégration de Sora-2 dans ComfyUI
Sora-2 est le modèle de génération vidéo de deuxième génération lancé par OpenAI. Contrairement aux modèles d'image, Sora-2 ne peut pas être déployé localement comme Stable Diffusion. Son intégration dans ComfyUI doit passer par l'une des deux voies suivantes :
| Méthode d'accès | Implémentation technique | Ressources requises | Faisabilité |
|---|---|---|---|
| Chargement du modèle local | Téléchargement des fichiers de poids pour exécution locale | VRAM GPU > 80 Go | ❌ Impossible (OpenAI n'est pas open source) |
| Appel par nœud API | Appeler l'API distante via des requêtes HTTP | Connexion Internet et clé API uniquement | ✅ Possible (Recommandé officiellement) |
| Alternatives Open Source | Utiliser des modèles comme Open-Sora | VRAM GPU ≥ 16 Go | ✅ Possible (Fonctionnalités limitées) |
Conclusion : Sora-2 doit impérativement être intégré à ComfyUI via des nœuds API, le déploiement local n'est pas supporté.
2.2 Tutoriel de configuration des nœuds API Sora-2 officiels
L'équipe de ComfyUI a déjà publié les "Sora-2 Partner Nodes", qui supportent les modes Texte-vers-Vidéo et Image-vers-Vidéo.
Étapes d'installation :
# Étape 1 : Assurez-vous que la version de ComfyUI est ≥ v0.2.6
cd ComfyUI
git pull origin main
# Étape 2 : Ajoutez le nœud Sora-2 au workflow
# 1. Double-cliquez sur le canevas vide
# 2. Recherchez "OpenAI Sora" ou "Sora-2-i2v"
# 3. Connectez les nœuds d'entrée (invite de texte ou image de référence)
Configuration des paramètres du nœud Sora-2 Pro :
| Paramètre | Type de donnée | Description | Valeur recommandée |
|---|---|---|---|
prompt |
String | Invite de description vidéo | "A drone shot of a coastal city" |
resolution |
Enum | Résolution vidéo | 1280x720 / 720x1280 |
duration |
Integer | Durée de la vidéo (secondes) | 5-20 secondes |
input_image |
Image | Image de référence (mode i2v) | Doit correspondre exactement à la résolution |
api_key |
String | Clé API OpenAI | sk-proj-... |
Notes importantes :
- ⚠️ Correspondance de résolution : En mode Image-vers-Vidéo, l'image d'entrée doit correspondre exactement à la résolution vidéo sélectionnée, sinon une erreur se produira.
- ⚠️ Contrôle des coûts : Sora-2 Pro est facturé à la seconde, une vidéo de 20 secondes coûte environ entre 0,50 $ et 1,00 $.
- ⚠️ Quotas API : OpenAI impose des limites d'appels quotidiens aux nouveaux comptes, il est nécessaire de demander une augmentation de quota à l'avance.

2.3 Nœuds API Sora-2 tiers (Solution Siray)
En plus des nœuds officiels, la communauté propose une version améliorée : les "Sora-2 Custom Nodes".
Caractéristiques du nœud Sora-2-i2v de Siray OpenAI :
# Installation des nœuds personnalisés de Siray
cd ComfyUI/custom_nodes
git clone https://github.com/siray-comfyui/openai-sora-2.git
pip install -r openai-sora-2/requirements.txt
Fonctionnalités améliorées :
| Fonctionnalité | Nœud officiel | Nœud Siray | Avantages |
|---|---|---|---|
| Génération par lots | ❌ | ✅ | Supporte le traitement automatique des files d'attente |
| Synchro audio | ❌ | ✅ | Permet de générer une musique de fond simultanément |
| Barre de progression | ❌ | ✅ | Affiche l'état d'avancement en temps réel |
| Cache local | ❌ | ✅ | Réduit les appels API redondants |
🎯 Conseil de workflow : Pour les équipes qui doivent générer une grande quantité de vidéos marketing, nous recommandons de combiner les nœuds de prétraitement de ComfyUI avec l'API Sora-2 pour construire un workflow automatisé. Via la plateforme APIYI (apiyi.com), vous pouvez obtenir des accès API Sora-2 plus stables, particulièrement adaptés aux scénarios de génération de masse, avec une gestion de file d'attente dédiée et des options d'optimisation des coûts.
III. Meilleures pratiques pour le workflow hybride Nano Banana Pro et Sora-2
La force de ComfyUI réside dans sa capacité à enchaîner plusieurs modèles d'IA pour créer des workflows complexes. Voici un processus de création Image-vers-Vidéo typique :
3.1 Architecture du workflow hybride
Schéma de flux :
[Invite textuelle]
↓
[Nœud Nano Banana Pro] → Génère une image de couverture haute qualité (4K)
↓
[Nœud de prétraitement d'image] → Ajuste la résolution à 1280x720
↓
[Nœud Sora-2 i2v] → Transforme l'image en une vidéo de 10 secondes
↓
[Nœud de post-traitement vidéo] → Ajoute des transitions et des effets sonores
↓
[Sortie finale] → Fichier vidéo MP4
Exemple de configuration des nœuds :
| Étape du workflow | Modèle utilisé | Paramètres clés | Temps de traitement |
|---|---|---|---|
| 1. Génération d'image | Nano Banana Pro | resolution=3840x2160, mode=generate |
8-15 s |
| 2. Ajustement résolution | ComfyUI intégré | target_size=1280x720, resize_mode=crop |
< 1 s |
| 3. Génération vidéo | Sora-2 Pro | duration=10, motion_intensity=medium |
60-120 s |
| 4. Export vidéo | Nœud FFmpeg | codec=h264, bitrate=5000k |
5-10 s |
3.2 Exemple de code pour le workflow réel
Version minimaliste du JSON Workflow ComfyUI (nœuds de base) :
{
"nodes": [
{
"id": 1,
"type": "TextInput",
"properties": {
"text": "A cyberpunk city with neon lights and flying cars"
}
},
{
"id": 2,
"type": "GoogleGeminiImage",
"properties": {
"api_key": "YOUR_API_KEY",
"prompt": "@1.text",
"resolution": "3840x2160"
}
},
{
"id": 3,
"type": "ImageResize",
"properties": {
"input": "@2.output",
"target_size": "1280x720"
}
},
{
"id": 4,
"type": "OpenAISora2",
"properties": {
"api_key": "YOUR_OPENAI_KEY",
"input_image": "@3.output",
"duration": 10
}
}
]
}
Cliquez pour afficher la configuration complète du workflow (paramètres avancés)
{
"version": "1.0",
"workflow_name": "Nano_Banana_to_Sora2_Video",
"nodes": [
{
"id": 1,
"type": "TextInput",
"properties": {
"text": "A cyberpunk city with neon lights and flying cars",
"negative_prompt": "blurry, low quality, distorted"
}
},
{
"id": 2,
"type": "GoogleGeminiImage",
"properties": {
"api_key": "YOUR_API_KEY",
"api_endpoint": "https://api.apiyi.com/v1/models/gemini-2.0-flash-exp:generateImage",
"prompt": "@1.text",
"negative_prompt": "@1.negative_prompt",
"resolution": "3840x2160",
"aspect_ratio": "16:9",
"guidance_scale": 7.5,
"num_inference_steps": 30
}
},
{
"id": 3,
"type": "ImageResize",
"properties": {
"input": "@2.output",
"target_size": "1280x720",
"resize_mode": "crop_center",
"interpolation": "lanczos"
}
},
{
"id": 4,
"type": "OpenAISora2Pro",
"properties": {
"api_key": "YOUR_OPENAI_KEY",
"input_image": "@3.output",
"prompt": "@1.text",
"duration": 10,
"resolution": "1280x720",
"motion_intensity": "medium",
"camera_motion": "pan_right",
"frame_rate": 30
}
},
{
"id": 5,
"type": "VideoExport",
"properties": {
"input": "@4.output",
"format": "mp4",
"codec": "h264",
"bitrate": "5000k",
"output_path": "./outputs/final_video.mp4"
}
}
],
"connections": [
{"from": 1, "to": 2, "type": "text"},
{"from": 2, "to": 3, "type": "image"},
{"from": 3, "to": 4, "type": "image"},
{"from": 4, "to": 5, "type": "video"}
]
}
🎯 Conseil d'optimisation des performances : Lors du traitement de tâches par lots, il est recommandé de séparer les appels API de Nano Banana Pro et de Sora-2 dans des files d'attente distinctes. Grâce aux fonctions d'équilibrage de charge de la plateforme APIYI (apiyi.com), vous pouvez traiter en parallèle la génération d'images et de vidéos, améliorant l'efficacité globale du workflow d'environ 40 %.
IV. Foire aux questions (FAQ)
Q1 : Nano Banana Pro et Sora-2 peuvent-ils fonctionner entièrement en local ?
Nano Banana Pro : ❌ Pas de support pour le déploiement local, passage obligatoire par des appels API.
Sora-2 : ❌ Pas de support pour le déploiement local, OpenAI n'a pas rendu publics les poids du modèle.
Alternative : Vous pouvez utiliser Stable Diffusion (image) et Open-Sora (vidéo) en open-source pour une exécution locale.
Q2 : Comment réduire les coûts d'appel à l'API Sora-2 ?
| Stratégie d'optimisation | Réduction des coûts | Difficulté de mise en œuvre |
|---|---|---|
| Raccourcir la durée (10s → 5s) | 50% | ⭐ Facile |
| Utiliser une basse résolution (720p → 480p) | 30% | ⭐ Facile |
| Appels par lots pour obtenir des remises | 15-20% | ⭐⭐ Moyenne |
| Utiliser une plateforme API tierce | 20-40% | ⭐⭐ Moyenne |
🎯 Conseil de gestion des coûts : Pour les utilisateurs dont la consommation mensuelle dépasse 500 $, nous recommandons de souscrire à un forfait entreprise via la plateforme APIYI (apiyi.com). La plateforme propose des tarifs dégressifs et des remises sur prépaiement, tout en centralisant la facturation pour Nano Banana Pro et Sora-2, ce qui simplifie vos processus financiers.
Q3 : La résolution des vidéos générées par Sora-2 dans ComfyUI est-elle limitée ?
Sora-2 Standard :
- ✅ Supporté : 720×1280, 1280×720
- ❌ Non supporté : 1080p, 4K
Sora-2 version Pro :
- ✅ Supporté : 720×1280, 1280×720, 1024×1792, 1792×1024
- ❌ Non supporté : Résolutions personnalisées
Solution : Utilisez les nœuds de super-résolution de ComfyUI (comme ESRGAN) pour upscaler une vidéo 720p en 1080p ou 4K.
Q4 : Comment transmettre automatiquement une image Nano Banana Pro à Sora-2 ?
Dans un workflow ComfyUI, vous devez faire attention au point suivant :
# Exemple d'erreur : Une connexion directe entraîne un conflit de résolution
[Nano Banana Pro] → [Sora-2 i2v] # ❌ Erreur probable
# Exemple correct : Ajouter un nœud de conversion de résolution entre les deux
[Nano Banana Pro] → [Image Resize] → [Sora-2 i2v] # ✅ Recommandé
Tableau de correspondance des résolutions :
| Sortie Nano Banana Pro | Ajustement nécessaire | Exigence d'entrée Sora-2 |
|---|---|---|
| 3840×2160 (4K) | ✅ Resize | 1280×720 |
| 1920×1080 (1080p) | ✅ Crop+Resize | 1280×720 |
| 1280×720 (720p) | ❌ Utilisation directe | 1280×720 |
Q5 : Quelles versions de ComfyUI supportent ces nouveaux modèles ?
| Modèle | Version minimale ComfyUI | Version recommandée | Comment l'obtenir |
|---|---|---|---|
| Nano Banana Pro (nœud officiel) | v0.2.3 | v0.2.7+ (nightly) | git pull origin main |
| Sora-2 (nœud officiel) | v0.2.6 | v0.2.8+ (nightly) | Idem |
| Nœuds personnalisés | Aucune restriction | Dernière version stable | Installation manuelle de l'extension |
V. Résumé et conseils de sélection
5.1 Récapitulatif des questions clés
Q : Quelle est la configuration la plus simple pour intégrer l'API Nano Banana Pro dans ComfyUI ?
R : Utilisez les "Partner Nodes" officiels, cela ne prend que trois étapes :
- Mettre à jour ComfyUI vers la version "nightly".
- Rechercher et ajouter le nœud "Google Gemini Image".
- Saisir votre clé API et votre invite pour commencer.
Q : Le modèle vidéo Sora-2 peut-il être intégré à ComfyUI ?
R : Oui, mais cela doit impérativement se faire via un nœud API. Le déploiement local n'est pas supporté. Des "Custom Nodes" pour Sora-2 sont disponibles via les canaux officiels et tiers.
5.2 Conseils de sélection selon les scénarios
| Scénario d'utilisation | Solution recommandée | Raison |
|---|---|---|
| Apprentissage et tests personnels | Partner Nodes officiels | Quota gratuit, configuration simple |
| Petit studio (<100 images/jour) | Custom Nodes + API officielle | Fonctionnalités riches, coûts maîtrisés |
| Environnement de production en entreprise | Plateforme API tierce (ex: APIYI) | Haute disponibilité, optimisation des coûts, support technique |
| Déploiement privé hors ligne | Alternatives Open Source (Stable Diffusion + Open-Sora) | Sécurité des données, aucune dépendance réseau |
🎯 Conseil final : Pour les utilisateurs ayant besoin d'utiliser simultanément Nano Banana Pro et Sora-2, nous recommandons de centraliser vos appels API via la plateforme APIYI (apiyi.com). Cette plateforme permet d'accéder aux deux modèles avec une seule clé API, simplifiant ainsi la gestion des clés tout en offrant un panneau de contrôle unifié et des outils d'analyse de coûts. Rendez-vous dès maintenant sur apiyi.com pour créer un compte ; les nouveaux utilisateurs reçoivent un crédit gratuit de 20 $ pour tester leurs flux de travail.
5.3 Ressources d'apprentissage complémentaires
Documentation officielle :
- Documentation officielle de ComfyUI : docs.comfy.org/tutorials/partner-nodes
- Référence API Nano Banana Pro : ai.google.dev/gemini-api
- Documentation API Sora-2 : platform.openai.com/docs/guides/sora
Ressources communautaires :
- Partage de workflows ComfyUI : comfyui.org/workflows
- Collection de nœuds personnalisés sur GitHub : github.com/ComfyUI-Workflow/awesome-comfyui
Tutoriels vidéo :
- "Tutoriel complet ComfyUI Nano Banana Pro" – YouTube
- "Démonstration pratique des nœuds API Sora-2" – Bilibili
Grâce aux explications détaillées de cet article, vous maîtrisez désormais l'écosystème complet de l'intégration de Nano Banana Pro et Sora-2 dans ComfyUI. Que vous choisissiez la simplicité des nœuds officiels, la flexibilité des nœuds personnalisés ou la robustesse d'une plateforme tierce pour entreprise, vous pouvez désormais adapter votre configuration à vos besoins réels.
Lancez ComfyUI dès maintenant et commencez votre voyage créatif avec l'IA !
Lectures recommandées :
- « Guide avancé ComfyUI : Construire un workflow d'automatisation de génération vidéo »
- « Nano Banana Pro vs Midjourney : Comparatif des modèles de génération d'images pour les entreprises »
- « Stratégies d'optimisation des coûts de l'API Sora-2 : Comment réduire les frais de génération vidéo de 70 % »
