ComfyUI — это опенсорсный инструмент для генерации изображений и видео, который уже стал выбором номер один для AI-креаторов. С выходом модели Nano Banana Pro от Google и видеомодели Sora-2 от OpenAI многих волнует главный вопрос: можно ли подключить эти топовые модели к ComfyUI и как сделать это проще всего?
В этой статье мы подробно разберем оба вопроса и предложим готовые решения: от официальных нод до сторонних API-платформ. Вы узнаете, как быстро задействовать всю мощь Nano Banana Pro и Sora-2 в своих воркфлоу.

1. Три способа подключения Nano Banana Pro API к ComfyUI
Nano Banana Pro — это флагманская модель генерации изображений от Google DeepMind, поддерживающая разрешение 4K, рендеринг текста на разных языках и высокую консистентность персонажей. Исходя из официальной документации и опыта сообщества, есть три основных способа интеграции в ComfyUI:
1.1 Официальные ноды ComfyUI Partner Nodes (рекомендуется для новичков)
Это самый простой способ, не требующий установки дополнительных плагинов. Команда ComfyUI уже интегрировала Nano Banana Pro в качестве нативной API-ноды.
Инструкция:
# 第一步:更新 ComfyUI 到 nightly 版本
cd ComfyUI
git pull origin main
python main.py
# 第二步:在 ComfyUI 界面中
# 1. 双击空白画布
# 2. 搜索 "Google Gemini Image" 节点
# 3. 拖拽到工作流中
Параметры ноды:
| Параметр | Обязательно | Описание | Пример |
|---|---|---|---|
api_key |
✅ | API-ключ Google AI Studio | AIzaSyC... |
prompt |
✅ | Текстовый промпт | "A futuristic city at sunset" |
mode |
✅ | Режим генерации | generate / edit / style_transfer |
resolution |
❌ | Разрешение на выходе | 1024x1024 / 1280x720 |
aspect_ratio |
❌ | Соотношение сторон | 16:9 / 4:3 / 1:1 |
Плюсы: Работает сразу из коробки, не нужно настраивать сервер или прокси.
Ограничения: Требуется API-ключ Google AI Studio, который может быть недоступен в некоторых регионах.
🎯 Совет по настройке: Для личных нужд и тестов лучше всего подходят официальные Partner Nodes. Если вам нужна стабильность корпоративного уровня, можно использовать платформу APIYI (apiyi.com). Она предоставляет отказоустойчивый API в оригинальном формате Google, так что код менять не придется, а расходы снизятся на 80%.
1.2 Кастомные ноды (для продвинутых пользователей)
Сообщество GitHub разработало опенсорсные ноды ComfyUI-NanoBanano, которые поддерживают более тонкие настройки.
Инструкция по установке:
# 进入 ComfyUI 自定义节点目录
cd ComfyUI/custom_nodes
# 克隆仓库
git clone https://github.com/ShmuelRonen/ComfyUI-NanoBanano.git
# 安装依赖
cd ComfyUI-NanoBanano
pip install -r requirements.txt
# 重启 ComfyUI
Доступные режимы:
| Режим | Описание | Когда использовать |
|---|---|---|
generate |
Текст в изображение | Создание артов с нуля |
edit |
Редактирование | Изменение отдельных частей изображения |
style_transfer |
Перенос стиля | Применение стиля одной картинки к другой |
object_insertion |
Вставка объекта | Точное добавление новых элементов |
Плюсы: Широкий функционал и поддержка мультимодальных операций.
Ограничения: Нужно вручную устанавливать и обновлять плагины.

1.3 Сторонние API-платформы (корпоративное решение)
Для компаний, которым важна высокая пропускная способность, минимальные задержки и оптимизация бюджета, сторонние API-платформы — оптимальный выбор.
Сравнение ключевых преимуществ:
| Критерий | Официальный Google API | Сторонние платформы (напр., APIYI) |
|---|---|---|
| Формат API | Нативный Google AI Studio | Полная совместимость с оригиналом |
| Перенос кода | — | Не требуется (только смена URL) |
| Стоимость | Стандартная | Дешевле примерно на 80% |
| Доступность | Зависит от серверов Google | Стабильный доступ, SLA 99.9% |
| Поддержка | Силами комьюнити | Техподдержка 24/7 |
Пример настройки (на базе APIYI):
# 原 Google 官方配置
api_endpoint = "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-exp:generateImage"
api_key = "YOUR_GOOGLE_API_KEY"
# 切换到 APIYI 平台(仅需修改这两行)
api_endpoint = "https://api.apiyi.com/v1/models/gemini-2.0-flash-exp:generateImage"
api_key = "YOUR_APIYI_API_KEY" # 从 apiyi.com 获取
🎯 Совет для бизнеса: Если ваша команда планирует массово генерировать изображения в ComfyUI, рекомендуем подключать Nano Banana Pro через платформу APIYI (apiyi.com). Там есть выделенные каналы ускорения и оплата по факту использования, что идеально подходит для продакшена с объемами от 1000 генераций в день.
2. Интеграция видеомодели Sora-2 в ComfyUI: анализ осуществимости и варианты настройки
Отвечая на главный вопрос клиента: "Можно ли использовать эту видеомодель в ComfyUI?", ответ: Да, но это делается через API-ноды.
2.1 Технические принципы подключения Sora-2 к ComfyUI
Sora-2 — это второе поколение видеомоделей от OpenAI. В отличие от имиджевых моделей, Sora-2 нельзя развернуть локально, как ту же Stable Diffusion. Доступ к ней в ComfyUI возможен только двумя путями:
| Способ подключения | Техническая реализация | Ресурсы | Осуществимость |
|---|---|---|---|
| Локальная загрузка модели | Загрузка файлов весов для локального запуска | Требуется видеопамять GPU > 80 ГБ | ❌ Невозможно (OpenAI не открыла исходный код) |
| Вызов через API-ноду | Запросы по HTTP к удаленному API | Нужен только интернет и API-ключ | ✅ Возможно (рекомендуемый способ) |
| Open-source альтернативы | Использование моделей вроде Open-Sora | Видеопамять GPU ≥ 16 ГБ | ✅ Возможно (функционал ограничен) |
Вывод: Sora-2 подключается к ComfyUI исключительно через API-ноды, локальное развертывание модели не поддерживается.
2.2 Инструкция по настройке официальных API-нод Sora-2
Команда ComfyUI уже выпустила Sora-2 Partner Nodes, которые поддерживают два режима: текст-в-видео (text-to-video) и изображение-в-видео (image-to-video).
Шаги установки:
# Шаг 1: Убедитесь, что версия ComfyUI ≥ v0.2.6
cd ComfyUI
git pull origin main
# Шаг 2: Добавьте ноду Sora-2 в рабочий процесс
# 1. Дважды кликните по пустому холсту
# 2. Введите в поиске "OpenAI Sora" или "Sora-2-i2v"
# 3. Подключите входные ноды (текстовый промпт или референсное изображение)
Параметры ноды Sora-2 Pro:
| Название параметра | Тип данных | Описание | Рекомендуемое значение |
|---|---|---|---|
prompt |
String | Текстовый промпт с описанием видео | "A drone shot of a coastal city" |
resolution |
Enum | Разрешение видео | 1280x720 / 720x1280 |
duration |
Integer | Длительность (сек) | 5-20 секунд |
input_image |
Image | Референс (для i2v) | Должно точно совпадать с разрешением |
api_key |
String | Ключ OpenAI API | sk-proj-... |
Важные примечания:
- ⚠️ Соответствие разрешения: В режиме «из картинки в видео» входное изображение должно точно соответствовать выбранному разрешению видео, иначе возникнет ошибка.
- ⚠️ Контроль затрат: Тарификация Sora-2 Pro посекундная, 20-секундный ролик обойдется примерно в $0.50-$1.00.
- ⚠️ Лимиты API: У OpenAI есть дневные лимиты для новых аккаунтов, стоит заранее подать заявку на их увеличение.

2.3 Сторонние API-ноды Sora-2 (решение Siray)
Помимо официальных нод, сообщество предлагает продвинутые версии Sora-2 Custom Nodes.
Особенности ноды Siray OpenAI Sora-2-i2v:
# Установка кастомных нод Siray
cd ComfyUI/custom_nodes
git clone https://github.com/siray-comfyui/openai-sora-2.git
pip install -r openai-sora-2/requirements.txt
Расширенный функционал:
| Функциональный модуль | Официальная нода | Нода Siray | Преимущества |
|---|---|---|---|
| Массовая генерация видео | ❌ | ✅ | Поддержка автоматической обработки очереди |
| Синхронная генерация аудио | ❌ | ✅ | Возможность одновременного создания фоновой музыки |
| Отображение прогресса | ❌ | ✅ | Реальное отображение хода генерации |
| Локальное кэширование | ❌ | ✅ | Снижает количество повторных вызовов API |
🎯 Совет по рабочему процессу: Командам, которым нужно создавать много маркетинговых видео, мы рекомендуем строить автоматизированные воркфлоу, сочетая ноды пре-процессинга ComfyUI и Sora-2 API. Через платформу APIYI (apiyi.com) можно получить более стабильный доступ к интерфейсам Sora-2 API, что особенно важно при массовой генерации видео. Платформа также предоставляет управление очередями и инструменты для оптимизации затрат.
3. Лучшие практики гибридного воркфлоу Nano Banana Pro и Sora-2
Сила ComfyUI заключается в том, что она позволяет объединять несколько ИИ-моделей в сложные цепочки. Ниже представлен типичный процесс создания из изображения в видео (image-to-video):
3.1 Проектирование архитектуры гибридного воркфлоу
Схема процесса:
[文本提示词]
↓
[Nano Banana Pro 节点] → 生成高质量封面图像 (4K)
↓
[图像预处理节点] → 调整分辨率到 1280x720
↓
[Sora-2 i2v 节点] → 将图像转为 10 秒视频
↓
[视频后处理节点] → 添加转场和音效
↓
[最终输出] → MP4 视频文件
Пример конфигурации узлов:
| Этап воркфлоу | Используемая модель | Ключевые параметры | Время обработки |
|---|---|---|---|
| 1. Генерация изображения | Nano Banana Pro | resolution=3840x2160, mode=generate |
8-15 сек |
| 2. Изменение разрешения | Встроенный узел ComfyUI | target_size=1280x720, resize_mode=crop |
< 1 сек |
| 3. Генерация видео | Sora-2 Pro | duration=10, motion_intensity=medium |
60-120 сек |
| 4. Экспорт видео | Узел FFmpeg | codec=h264, bitrate=5000k |
5-10 сек |
3.2 Пример реального воркфлоу в коде
Минималистичный JSON воркфлоу ComfyUI (основные узлы):
{
"nodes": [
{
"id": 1,
"type": "TextInput",
"properties": {
"text": "A cyberpunk city with neon lights and flying cars"
}
},
{
"id": 2,
"type": "GoogleGeminiImage",
"properties": {
"api_key": "YOUR_API_KEY",
"prompt": "@1.text",
"resolution": "3840x2160"
}
},
{
"id": 3,
"type": "ImageResize",
"properties": {
"input": "@2.output",
"target_size": "1280x720"
}
},
{
"id": 4,
"type": "OpenAISora2",
"properties": {
"api_key": "YOUR_OPENAI_KEY",
"input_image": "@3.output",
"duration": 10
}
}
]
}
Нажмите, чтобы развернуть полную конфигурацию воркфлоу (с расширенными параметрами)
{
"version": "1.0",
"workflow_name": "Nano_Banana_to_Sora2_Video",
"nodes": [
{
"id": 1,
"type": "TextInput",
"properties": {
"text": "A cyberpunk city with neon lights and flying cars",
"negative_prompt": "blurry, low quality, distorted"
}
},
{
"id": 2,
"type": "GoogleGeminiImage",
"properties": {
"api_key": "YOUR_API_KEY",
"api_endpoint": "https://api.apiyi.com/v1/models/gemini-2.0-flash-exp:generateImage",
"prompt": "@1.text",
"negative_prompt": "@1.negative_prompt",
"resolution": "3840x2160",
"aspect_ratio": "16:9",
"guidance_scale": 7.5,
"num_inference_steps": 30
}
},
{
"id": 3,
"type": "ImageResize",
"properties": {
"input": "@2.output",
"target_size": "1280x720",
"resize_mode": "crop_center",
"interpolation": "lanczos"
}
},
{
"id": 4,
"type": "OpenAISora2Pro",
"properties": {
"api_key": "YOUR_OPENAI_KEY",
"input_image": "@3.output",
"prompt": "@1.text",
"duration": 10,
"resolution": "1280x720",
"motion_intensity": "medium",
"camera_motion": "pan_right",
"frame_rate": 30
}
},
{
"id": 5,
"type": "VideoExport",
"properties": {
"input": "@4.output",
"format": "mp4",
"codec": "h264",
"bitrate": "5000k",
"output_path": "./outputs/final_video.mp4"
}
}
],
"connections": [
{"from": 1, "to": 2, "type": "text"},
{"from": 2, "to": 3, "type": "image"},
{"from": 3, "to": 4, "type": "image"},
{"from": 4, "to": 5, "type": "video"}
]
}
🎯 Совет по оптимизации производительности: При выполнении пакетных задач рекомендуем разделять API-вызовы для Nano Banana Pro и Sora-2 в разные очереди. Благодаря функции балансировки нагрузки на платформе APIYI apiyi.com можно реализовать параллельную генерацию изображений и видео, что повышает общую эффективность воркфлоу примерно на 40%.
4. Часто задаваемые вопросы (FAQ)
Q1: Можно ли запускать Nano Banana Pro и Sora-2 полностью локально?
Nano Banana Pro: ❌ Не поддерживает локальное развертывание, необходимо использовать API-вызовы.
Sora-2: ❌ Не поддерживает локальное развертывание, OpenAI не открывала веса модели.
Альтернативы: Для локального запуска можно использовать Stable Diffusion (для изображений) и Open-Sora (для видео).
Q2: Как снизить затраты на вызовы Sora-2 API?
| Стратегия оптимизации | Снижение стоимости | Сложность внедрения |
|---|---|---|
| Сокращение длительности видео (10с → 5с) | 50% | ⭐ Легко |
| Использование низкого разрешения (720p → 480p) | 30% | ⭐ Легко |
| Пакетные вызовы для получения скидки | 15-20% | ⭐⭐ Средне |
| Использование сторонних API-платформ | 20-40% | ⭐⭐ Средне |
🎯 Совет по управлению расходами: Пользователям с ежемесячным расходом более 500 долларов мы рекомендуем оформить корпоративный тариф на платформе APIYI apiyi.com. Платформа предлагает ступенчатое ценообразование и скидки при предоплате, а также поддерживает единое управление счетами для Nano Banana Pro и Sora-2, что упрощает финансовую отчетность.
Q3: Ограничено ли разрешение видео, создаваемого Sora-2 в ComfyUI?
Стандартная версия Sora-2:
- ✅ Поддерживает: 720×1280, 1280×720
- ❌ Не поддерживает: 1080p, 4K
Версия Sora-2 Pro:
- ✅ Поддерживает: 720×1280, 1280×720, 1024×1792, 1792×1024
- ❌ Не поддерживает: произвольные разрешения
Решение: Используйте узлы апскейла (Super-Resolution), например ESRGAN, в ComfyUI, чтобы увеличить разрешение видео с 720p до 1080p или 4K.
Q4: Как автоматически передать изображение из Nano Banana Pro в Sora-2?
В воркфлоу ComfyUI важно учитывать следующие моменты:
# Ошибка: прямое соединение может привести к несовпадению разрешений
[Nano Banana Pro] → [Sora-2 i2v] # ❌ Возможна ошибка
# Правильно: добавление узла изменения разрешения
[Nano Banana Pro] → [Image Resize] → [Sora-2 i2v] # ✅ Рекомендуется
Таблица соответствия разрешений:
| Выход Nano Banana Pro | Требуется правка | Входные требования Sora-2 |
|---|---|---|
| 3840×2160 (4K) | ✅ Ресайз | 1280×720 |
| 1920×1080 (1080p) | ✅ Кроп + Ресайз | 1280×720 |
| 1280×720 (720p) | ❌ Использовать напрямую | 1280×720 |
Q5: Какие версии ComfyUI поддерживают эти новые модели?
| Модель | Минимальная версия ComfyUI | Рекомендуемая версия | Как получить |
|---|---|---|---|
| Nano Banana Pro (официальный узел) | v0.2.3 | v0.2.7+ (nightly) | git pull origin main |
| Sora-2 (официальный узел) | v0.2.6 | v0.2.8+ (nightly) | аналогично |
| Кастомные узлы | Без ограничений | Последняя стабильная | Ручная установка плагинов |
5. Заключение и рекомендации по выбору
5.1 Ответы на ключевые вопросы
В: Какая конфигурация для подключения Nano Banana Pro API к ComfyUI самая простая?
О: Используйте официальные Partner Nodes, это займет всего три шага:
- Обновите ComfyUI до nightly-версии.
- Найдите и добавьте узел «Google Gemini Image».
- Введите API-ключ и промпт — и можно работать.
В: Можно ли подключить видеомодель Sora-2 к ComfyUI?
О: Да, но только через API-узлы. Локальное развертывание модели не поддерживается. И официальные, и сторонние разработчики уже выпустили готовые Custom Nodes для Sora-2.
5.2 Рекомендации по выбору для разных сценариев
| Сценарий использования | Рекомендуемое решение | Почему именно оно? |
|---|---|---|
| Личное обучение и тесты | Официальные Partner Nodes | Есть бесплатные лимиты, простая настройка. |
| Малые студии (<100 изобр./день) | Custom Nodes + официальный API | Богатый функционал, полный контроль над расходами. |
| Корпоративная рабочая среда | Сторонние API-платформы (например, APIYI) | Высокая доступность, оптимизация затрат, техподдержка. |
| Автономное приватное развертывание | Open-source альтернативы (Stable Diffusion + Open-Sora) | Безопасность данных, никакой зависимости от интернета. |
🎯 Итоговый совет: Пользователям, которым нужно работать одновременно с Nano Banana Pro и Sora-2, мы рекомендуем использовать платформу APIYI (apiyi.com) для централизованного управления вызовами. Она позволяет использовать один API-ключ для доступа к обеим моделям, упрощает менеджмент ключей и предоставляет единую панель мониторинга и анализа затрат. Зарегистрируйтесь на apiyi.com прямо сейчас — новые пользователи получают бесплатный лимит в $20 для тестирования своих воркфлоу.
5.3 Дополнительные ресурсы для обучения
Официальная документация:
- Документация ComfyUI: docs.comfy.org/tutorials/partner-nodes
- Справочник Nano Banana Pro API: ai.google.dev/gemini-api
- Документация Sora-2 API: platform.openai.com/docs/guides/sora
Ресурсы сообщества:
- Шеринг воркфлоу ComfyUI: comfyui.org/workflows
- Коллекция кастомных узлов на GitHub: github.com/ComfyUI-Workflow/awesome-comfyui
Видеоуроки:
- «Полный туториал по ComfyUI Nano Banana Pro» — YouTube
- «Практическая демонстрация Sora-2 API Nodes» — Bilibili
Благодаря этому подробному руководству вы теперь полностью разбираетесь в том, как интегрировать Nano Banana Pro и Sora-2 в ComfyUI. Что бы вы ни выбрали — простоту официальных узлов, гибкость кастомных решений или корпоративный сервис сторонних платформ — ориентируйтесь на свои реальные задачи.
Так что открывайте ComfyUI и начинайте свой творческий путь в мире ИИ!
Рекомендуем почитать:
- «Продвинутое руководство по ComfyUI: создание автоматизированных воркфлоу для генерации видео»
- «Nano Banana Pro vs Midjourney: сравнение моделей генерации изображений корпоративного уровня»
- «Стратегии оптимизации затрат на Sora-2 API: как снизить расходы на генерацию видео на 70%»
