|

Nano Banana Pro と Sora-2 を ComfyUI に導入するための完全設定ガイド:最も簡単な API 連携ソリューション

ComfyUI はオープンソースの画像・動画生成ツールとして、AI クリエイターにとって最適なプラットフォームとなっています。Google が発表した画像モデル「Nano Banana Pro」や OpenAI がリリースした動画モデル「Sora-2」の登場により、多くのユーザーが核心的な疑問を抱いています。「これらの最先端モデルを ComfyUI に接続できるのか? 最も簡単な設定方法は?」

本記事では、これら2つの疑問に深くお答えし、公式ノードからサードパーティの API プラットフォームまで、完全な接続プランを提供します。これにより、ComfyUI 内で Nano Banana Pro と Sora-2 の強力な機能を素早く呼び出せるようになります。

nano-banana-pro-sora-2-comfyui-integration-guide-ja 图示


一、Nano Banana Pro API を ComfyUI に接続する3つの方法

Nano Banana Pro は Google DeepMind が発表したフラッグシップ級の画像生成モデルで、4K 解像度、多言語テキストレンダリング、そして高い忠実度のキャラクター一貫性をサポートしています。公式ドキュメントとコミュニティの実践に基づくと、ComfyUI への接続には主に以下の3つの方法があります。

1.1 公式 ComfyUI Partner Nodes (初心者推奨)

これは 最も簡単 な接続方法で、プラグインをインストールする必要はありません。ComfyUI 公式が Nano Banana Pro をネイティブ API ノードとして統合しています。

操作手順:

# ステップ 1: ComfyUI を nightly バージョンに更新する
cd ComfyUI
git pull origin main
python main.py

# ステップ 2: ComfyUI インターフェースにて
# 1. 空白のキャンバスをダブルクリック
# 2. "Google Gemini Image" ノードを検索
# 3. ワークフローにドラッグ&ドロップ

ノード設定パラメータ:

パラメータ名 必須 説明
api_key Google AI Studio API キー AIzaSyC...
prompt テキストプロンプト "A futuristic city at sunset"
mode 生成モード generate / edit / style_transfer
resolution 出力解像度 1024x1024 / 1280x720
aspect_ratio アスペクト比 16:9 / 4:3 / 1:1

メリット: 設定後すぐに利用可能、サーバーやプロキシの設定が不要
制限: Google AI Studio API キーが必要であり、一部の地域では制限される場合がある

🎯 設定のアドバイス: 個人ユーザーや小規模なテストには、公式 Partner Nodes プランをお勧めします。より安定したエンタープライズ級のサービスが必要な場合は、APIYI (apiyi.com) プラットフォームを通じて高可用な API インターフェースを取得できます。このプラットフォームは Google ネイティブ形式を使用しているため、コードを変更せずに公式 API を置き換えることができ、コストを 80% 削減できます。

1.2 カスタム Custom Nodes (高度なユーザー向け)

GitHub コミュニティでは、より高度な機能をサポートするオープンソースの ComfyUI-NanoBanano カスタムノードが提供されています。

インストール手順:

# ComfyUI のカスタムノードディレクトリに移動
cd ComfyUI/custom_nodes

# リポジトリをクローン
git clone https://github.com/ShmuelRonen/ComfyUI-NanoBanano.git

# 依存関係をインストール
cd ComfyUI-NanoBanano
pip install -r requirements.txt

# ComfyUI を再起動

サポートされている操作モード:

モード 機能説明 適用シーン
generate テキストから画像を生成 ゼロからの新規作成
edit 画像の編集・修正 既存画像の部分的な修正
style_transfer スタイル転送 ある画像のスタイルを別の画像に適用
object_insertion オブジェクトの挿入 画像内に新しい要素を精密に挿入

メリット: 機能がより豊富で、マルチモーダルな操作に対応
制限: プラグインの手動メンテナンスと更新が必要

nano-banana-pro-sora-2-comfyui-integration-guide-ja 图示

1.3 サードパーティ API プラットフォーム (エンタープライズ級プラン)

高い同時実行性、低レイテンシ、およびコスト最適化を必要とする企業ユーザーにとって、サードパーティの API プラットフォームはより優れたソリューションを提供します。

主要なメリットの比較:

比較項目 Google 公式 API サードパーティプラットフォーム (APIYI など)
API 形式 Google AI Studio ネイティブ Google ネイティブ形式と互換
コード移行 変更不要 2つのパラメータを置き換えるだけ
コスト 標準価格 約 80% 削減
可用性 Google サーバーに依存 高速アクセス、99.9% の SLA
技術サポート コミュニティサポート 24時間365日の技術チーム対応

設定例 (APIYI を使用する場合):

# 元の Google 公式設定
api_endpoint = "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-exp:generateImage"
api_key = "YOUR_GOOGLE_API_KEY"

# APIYI プラットフォームへの切り替え (これら2行を修正するだけ)
api_endpoint = "https://api.apiyi.com/v1/models/gemini-2.0-flash-exp:generateImage"
api_key = "YOUR_APIYI_API_KEY"  # apiyi.com から取得

🎯 企業選定のアドバイス: チームで ComfyUI を使用して画像生成タスクをバッチ処理する必要がある場合は、APIYI (apiyi.com) プラットフォーム経由で Nano Banana Pro API を接続することをお勧めします。このプラットフォームは専用の加速チャネルと従量課金モデルを提供しており、1日1,000枚以上の画像を処理する本番環境に特に適しています。


2. Sora-2 動画モデルの ComfyUI 連携:実現可能性の分析と設定プラン

クライアントの核心的な質問である 「Is it possible to use this video model in comfyUI?(この動画モデルを ComfyUI で使用することは可能ですか?)」 に対する答えは、「可能ですが、API ノード経由での連携が必要です」 となります。

2.1 Sora-2 連携における ComfyUI の技術原理

Sora-2 は OpenAI がリリースした第二世代の動画生成モデルです。画像モデルとは異なり、Sora-2 は Stable Diffusion のように ローカル環境にデプロイすることはできません。ComfyUI で利用するには、以下の 2 つのいずれかの経路を辿る必要があります。

連携方式 技術的実装 リソース要件 実現可能性
ローカルモデルのロード 重みファイルをダウンロードしてローカルで実行 GPU ビデオメモリ > 80GB ❌ 不可 (OpenAI が非公開)
API ノード呼び出し HTTP リクエスト経由でリモート API を呼び出し ネットワーク接続と API キーのみ ✅ 可能 (公式推奨)
オープンソース代替案 Open-Sora などのオープンソースモデルを使用 GPU ビデオメモリ ≥ 16GB ✅ 可能 (機能制限あり)

結論: Sora-2 は API ノード 形式で ComfyUI に連携させる必要があり、ローカルモデルのデプロイには対応していません。

2.2 公式 Sora-2 API ノード設定チュートリアル

ComfyUI 公式から Sora-2 パートナーノードがリリースされており、テキストからの動画生成(t2v)と画像からの動画生成(i2v)の 2 つのモードをサポートしています。

インストール手順:

# ステップ 1: ComfyUI のバージョンが v0.2.6 以上であることを確認
cd ComfyUI
git pull origin main

# ステップ 2: ワークフローに Sora-2 ノードを追加
# 1. 空白のキャンバスをダブルクリック
# 2. "OpenAI Sora" または "Sora-2-i2v" を検索
# 3. 入力ノード(テキストプロンプトまたは参照画像)を接続

Sora-2 Pro ノードのパラメータ設定:

パラメータ名 データ型 説明 推奨値
prompt String 動画の説明プロンプト "A drone shot of a coastal city"
resolution Enum 動画の解像度 1280x720 / 720x1280
duration Integer 動画の長さ(秒) 5-20 秒
input_image Image 参照画像 (i2v モード) 解像度を正確に合わせる必要あり
api_key String OpenAI API キー sk-proj-...

重要な注意事項:

  • ⚠️ 解像度のマッチング: 画像から動画を生成するモードでは、入力画像が選択した動画解像度と 正確に一致 している必要があります。そうでない場合はエラーが発生します。
  • ⚠️ コスト管理: Sora-2 Pro は秒単位での課金制です。20 秒の動画で約 $0.50 – $1.00 程度のコストがかかります。
  • ⚠️ API クォータ: OpenAI は新規アカウントに対して 1 日あたりの呼び出し制限を設けているため、事前に追加割り当てを申請しておく必要があります。

nano-banana-pro-sora-2-comfyui-integration-guide-ja 图示

2.3 サードパーティ製 Sora-2 API ノード (Siray プラン)

公式ノードの他に、コミュニティからは機能が強化された Sora-2 カスタムノードも提供されています。

Siray OpenAI Sora-2-i2v ノードの特徴:

# Siray カスタムノードのインストール
cd ComfyUI/custom_nodes
git clone https://github.com/siray-comfyui/openai-sora-2.git
pip install -r openai-sora-2/requirements.txt

拡張機能:

機能モジュール 公式ノード Siray ノード メリット
動画のバッチ生成 キューによる自動処理をサポート
音声の同期生成 BGM の同時生成が可能
プログレスバー表示 生成の進捗をリアルタイムに表示
ローカルキャッシュ 重複する API 呼び出しを削減

🎯 ワークフローのアドバイス: 大量のマーケティング動画を生成する必要があるチームには、ComfyUI の前処理ノードと Sora-2 API を組み合わせた自動化ワークフローの構築をお勧めします。APIYI(apiyi.com)プラットフォーム経由で、より安定した Sora-2 API インターフェースを取得でき、特に大量生成のシナリオに適した専用キュー管理とコスト最適化プランが提供されています。

三、Nano Banana Pro と Sora-2 混合ワークフローのベストプラクティス

ComfyUI の強力な点は、複数の AI モデルを連結して複雑なワークフローを構築できることです。以下は典型的な 画像から動画 (Image-to-Video) を作成するフローです。

3.1 混合ワークフローのアーキテクチャ設計

フロー図:

[テキストプロンプト]
    ↓
[Nano Banana Pro ノード] → 高品質なカバー画像を生成 (4K)
    ↓
[画像前処理ノード] → 解像度を 1280x720 に調整
    ↓
[Sora-2 i2v ノード] → 画像を 10 秒の動画に変換
    ↓
[動画後処理ノード] → トランジションと効果音を追加
    ↓
[最終出力] → MP4 動画ファイル

ノード設定例:

ワークフロー段階 使用モデル 主要パラメータ 処理時間
1. 画像生成 Nano Banana Pro resolution=3840x2160, mode=generate 8-15 秒
2. 解像度調整 ComfyUI 内蔵 target_size=1280x720, resize_mode=crop < 1 秒
3. 動画生成 Sora-2 Pro duration=10, motion_intensity=medium 60-120 秒
4. 動画書き出し FFmpeg ノード codec=h264, bitrate=5000k 5-10 秒

3.2 実際のワークフローコード例

最小構成版 ComfyUI Workflow JSON (コアノード):

{
  "nodes": [
    {
      "id": 1,
      "type": "TextInput",
      "properties": {
        "text": "A cyberpunk city with neon lights and flying cars"
      }
    },
    {
      "id": 2,
      "type": "GoogleGeminiImage",
      "properties": {
        "api_key": "YOUR_API_KEY",
        "prompt": "@1.text",
        "resolution": "3840x2160"
      }
    },
    {
      "id": 3,
      "type": "ImageResize",
      "properties": {
        "input": "@2.output",
        "target_size": "1280x720"
      }
    },
    {
      "id": 4,
      "type": "OpenAISora2",
      "properties": {
        "api_key": "YOUR_OPENAI_KEY",
        "input_image": "@3.output",
        "duration": 10
      }
    }
  ]
}
クリックして詳細なワークフロー設定を展開 (高度なパラメータを含む)
{
  "version": "1.0",
  "workflow_name": "Nano_Banana_to_Sora2_Video",
  "nodes": [
    {
      "id": 1,
      "type": "TextInput",
      "properties": {
        "text": "A cyberpunk city with neon lights and flying cars",
        "negative_prompt": "blurry, low quality, distorted"
      }
    },
    {
      "id": 2,
      "type": "GoogleGeminiImage",
      "properties": {
        "api_key": "YOUR_API_KEY",
        "api_endpoint": "https://api.apiyi.com/v1/models/gemini-2.0-flash-exp:generateImage",
        "prompt": "@1.text",
        "negative_prompt": "@1.negative_prompt",
        "resolution": "3840x2160",
        "aspect_ratio": "16:9",
        "guidance_scale": 7.5,
        "num_inference_steps": 30
      }
    },
    {
      "id": 3,
      "type": "ImageResize",
      "properties": {
        "input": "@2.output",
        "target_size": "1280x720",
        "resize_mode": "crop_center",
        "interpolation": "lanczos"
      }
    },
    {
      "id": 4,
      "type": "OpenAISora2Pro",
      "properties": {
        "api_key": "YOUR_OPENAI_KEY",
        "input_image": "@3.output",
        "prompt": "@1.text",
        "duration": 10,
        "resolution": "1280x720",
        "motion_intensity": "medium",
        "camera_motion": "pan_right",
        "frame_rate": 30
      }
    },
    {
      "id": 5,
      "type": "VideoExport",
      "properties": {
        "input": "@4.output",
        "format": "mp4",
        "codec": "h264",
        "bitrate": "5000k",
        "output_path": "./outputs/final_video.mp4"
      }
    }
  ],
  "connections": [
    {"from": 1, "to": 2, "type": "text"},
    {"from": 2, "to": 3, "type": "image"},
    {"from": 3, "to": 4, "type": "image"},
    {"from": 4, "to": 5, "type": "video"}
  ]
}

🎯 パフォーマンス最適化のアドバイス: 大量のアセットを処理する場合、Nano Banana Pro と Sora-2 の API コールを別々のキューに分けることをお勧めします。APIYI (apiyi.com) プラットフォームのロードバランシング機能を利用することで、画像生成と動画生成の並列処理が可能になり、ワークフロー全体の効率が約 40% 向上します。


四、よくある質問 (FAQ)

Q1: Nano Banana Pro と Sora-2 は完全にローカルで実行できますか?

Nano Banana Pro: ❌ ローカルデプロイには対応していません。必ず API 経由で呼び出す必要があります。
Sora-2: ❌ ローカルデプロイには対応していません。OpenAI はモデルの重みをオープンソース化していません。
代替案: ローカル環境で実行したい場合は、オープンソースの Stable Diffusion (画像) や Open-Sora (動画) を使用することを検討してください。

Q2: Sora-2 の API コールコストを抑えるにはどうすればよいですか?

最適化戦略 コスト削減幅 実施難易度
動画の長さを短縮する (10秒→5秒) 50% ⭐ 簡単
低解像度を使用する (720p→480p) 30% ⭐ 簡単
一括呼び出しで割引を適用する 15-20% ⭐⭐ 普通
サードパーティの API プラットフォームを利用する 20-40% ⭐⭐ 普通

🎯 コスト管理のアドバイス: 月間の利用額が 500 ドルを超えるユーザー様には、APIYI (apiyi.com) プラットフォームの法人プランの契約をお勧めします。段階的な価格設定やプリペイド割引が提供されており、Nano Banana Pro と Sora-2 の請求を一括管理できるため、経理フローも簡素化されます。

Q3: ComfyUI で Sora-2 が生成する動画の解像度に制限はありますか?

Sora-2 標準版:

  • ✅ 対応: 720×1280, 1280×720
  • ❌ 非対応: 1080p, 4K

Sora-2 Pro 版:

  • ✅ 対応: 720×1280, 1280×720, 1024×1792, 1792×1024
  • ❌ 非対応: カスタム解像度

解決策: ComfyUI の超解像ノード (ESRGAN など) を使用して、720p の動画を 1080p や 4K にアップスケーリングしてください。

Q4: Nano Banana Pro で生成した画像を自動的に Sora-2 に渡すには?

ComfyUI ワークフローでは、以下の重要なポイントに注意してください。

# 誤った例: 直接接続すると解像度の不一致が発生する可能性があります
[Nano Banana Pro] → [Sora-2 i2v]  # ❌ エラーが発生する可能性あり

# 正しい例: 間に解像度変換ノードを挟む
[Nano Banana Pro] → [Image Resize] → [Sora-2 i2v]  # ✅ 推奨

解像度マッチング表:

Nano Banana Pro 出力 調整の要否 Sora-2 入力要件
3840×2160 (4K) ✅ リサイズが必要 1280×720
1920×1080 (1080p) ✅ クロップ+リサイズ 1280×720
1280×720 (720p) ❌ そのまま使用可能 1280×720

Q5: どの ComfyUI バージョンがこれらの新モデルをサポートしていますか?

モデル 最小 ComfyUI バージョン 推奨バージョン 入手方法
Nano Banana Pro (公式ノード) v0.2.3 v0.2.7+ (nightly) git pull origin main
Sora-2 (公式ノード) v0.2.6 v0.2.8+ (nightly) 同上
カスタムノード 制限なし 最新安定版 プラグインを手動インストール

5. まとめと選定のアドバイス

5.1 核心的なQ&Aの振り返り

Q: Nano Banana Pro API を ComfyUI に導入する際の最も簡単な構成は何ですか?
A: 公式の Partner Nodes を使用すれば、わずか3ステップで完了します:

  1. ComfyUI を nightly バージョンに更新する
  2. 「Google Gemini Image」ノードを検索して追加する
  3. APIキーとプロンプトを入力するだけで使用可能

Q: Sora-2 動画モデルは ComfyUI に接続できますか?
A: はい、可能です。ただし、必ず APIノード 経由で呼び出す必要があり、ローカルでのモデルデプロイには対応していません。公式およびサードパーティから、すぐに使える Sora-2 のカスタムノード(Custom Nodes)が提供されています。

5.2 利用シーン別の推奨ソリューション

利用シーン 推奨プラン 理由
個人の学習・テスト 公式 Partner Nodes 無料枠があり、設定が簡単
小規模スタジオ(100枚以下/日) カスタムノード + 公式API 機能が豊富で、コスト管理もしやすい
企業の本番環境 サードパーティAPIプラットフォーム(例:APIYI) 高可用性、コスト最適化、テクニカルサポート
オフライン・プライベートデプロイ オープンソースの代替案(Stable Diffusion + Open-Sora) データセキュリティ、ネットワーク依存なし

🎯 最終的なアドバイス: Nano Banana Pro と Sora-2 を併用する必要があるユーザーには、APIYI(apiyi.com) プラットフォームを通じて API 呼び出しを一元管理することをお勧めします。このプラットフォームは、1つのAPIキーで両方のモデルにアクセスできるため、キーの管理が簡素化されるだけでなく、統合されたモニタリングパネルやコスト分析ツールも提供されます。今すぐ apiyi.com でアカウントを登録しましょう。新規ユーザーは、ワークフローのテストに使用できる20ドル相当の無料クレジットを獲得できます。

5.3 さらなる学習リソース

公式ドキュメント:

  • ComfyUI 公式ドキュメント: docs.comfy.org/tutorials/partner-nodes
  • Nano Banana Pro API リファレンス: ai.google.dev/gemini-api
  • Sora-2 API ドキュメント: platform.openai.com/docs/guides/sora

コミュニティリソース:

  • ComfyUI ワークフロー共有: comfyui.org/workflows
  • GitHub カスタムノード集: github.com/ComfyUI-Workflow/awesome-comfyui

動画チュートリアル:

  • 「ComfyUI Nano Banana Pro 完全ガイド」 – YouTube
  • 「Sora-2 API Nodes 実践デモンストレーション」 – Bilibili

本記事の詳しい解説を通じて、Nano Banana Pro と Sora-2 を ComfyUI に導入するための体系的な知識を習得できたはずです。公式ノードの手軽さを選ぶか、カスタムノードの柔軟性を選ぶか、あるいはサードパーティプラットフォームによるエンタープライズ級のサービスを選ぶかは、ご自身の実際のニーズに合わせて柔軟に選択してください。

さあ、今すぐ ComfyUI を開いて、あなたの AI 創作の旅を始めましょう!

おすすめの関連記事:

  • 『ComfyUI 中級ガイド:自動動画生成ワークフローの構築』
  • 『Nano Banana Pro vs Midjourney:エンタープライズ級画像生成モデルの比較』
  • 『Sora-2 API コスト最適化戦略:動画生成費用を70%削減する方法』

類似投稿