|

دليل التهيئة الكامل لربط Nano Banana Pro و Sora-2 بـ ComfyUI: أبسط حل لتكامل API

تُعد ComfyUI، كأداة مفتوحة المصدر لإنشاء الصور والفيديو، المنصة المفضلة لمبدعي الذكاء الاصطناعي حالياً. ومع إطلاق جوجل لنموذج الصور Nano Banana Pro وإصدار OpenAI لنموذج الفيديو Sora-2، يتساءل الكثير من المستخدمين عن سؤال جوهري: هل يمكن ربط هذه النماذج الرائدة بـ ComfyUI؟ وكيف يتم ذلك بأبسط طريقة؟

في هذا المقال، سنجيب بعمق على هذين السؤالين، وسنقدم حلول ربط كاملة بدءاً من العقد الرسمية وصولاً إلى منصات واجهة برمجة التطبيقات (API) الخارجية، لمساعدتك في استدعاء القدرات الهائلة لـ Nano Banana Pro و Sora-2 داخل ComfyUI بسرعة وسهولة.

nano-banana-pro-sora-2-comfyui-integration-guide-ar 图示


أولاً: ثلاثة حلول لربط Nano Banana Pro API بـ ComfyUI

يُعد Nano Banana Pro النموذج الرائد لتوليد الصور الذي أطلقه Google DeepMind، وهو يدعم دقة 4K، ومعالجة النصوص بلغات متعددة، واتساقاً عالياً في ملامح الشخصيات. بناءً على الوثائق الرسمية وتجارب المجتمع، هناك ثلاث طرق رئيسية لربطه بـ ComfyUI:

1.1 عقد شركاء ComfyUI الرسمية (موصى بها للمبتدئين)

هذه هي الطريقة الأسهل للربط، ولا تتطلب تثبيت أي إضافات. قامت ComfyUI رسمياً بدمج Nano Banana Pro كعقدة واجهة برمجة تطبيقات (API) أصلية.

خطوات العمل:

# الخطوة الأولى: تحديث ComfyUI إلى إصدار nightly
cd ComfyUI
git pull origin main
python main.py

# الخطوة الثانية: في واجهة ComfyUI
# 1. انقر نقراً مزدوجاً على المساحة الفارغة
# 2. ابحث عن عقدة "Google Gemini Image"
# 3. اسحبها إلى سير العمل

معلمات تكوين العقدة:

اسم المعلمة مطلوب الوصف قيمة تجريبية
api_key مفتاح API الخاص بـ Google AI Studio AIzaSyC...
prompt موجه النص "A futuristic city at sunset"
mode وضع التوليد generate / edit / style_transfer
resolution دقة المخرجات 1024x1024 / 1280x720
aspect_ratio نسبة العرض إلى الارتفاع 16:9 / 4:3 / 1:1

المميزات: جاهزة للاستخدام فوراً، لا حاجة لتكوين خوادم أو بروكسي.
القيود: تتطلب مفتاح API من Google AI Studio، وقد تخضع لبعض القيود الجغرافية.

🎯 نصيحة التكوين: للمستخدمين الأفراد والاختبارات الصغيرة، نوصي باستخدام حل عقد الشركاء الرسمية. وإذا كنت بحاجة إلى خدمة أكثر استقراراً على مستوى المؤسسات، يمكنك الحصول على واجهة API عالية التوفر من خلال منصة APIYI (apiyi.com)، حيث تستخدم المنصة التنسيق الأصلي لجوجل، مما يسمح باستبدال API الرسمي دون تعديل الكود، مع تقليل التكاليف بنسبة 80%.

1.2 العقد المخصصة – Custom Nodes (للمستخدمين المتقدمين)

يوفر مجتمع GitHub عقد ComfyUI-NanoBanano المخصصة مفتوحة المصدر، والتي تدعم ميزات متقدمة أكثر.

خطوات التثبيت:

# الدخول إلى دليل العقد المخصصة في ComfyUI
cd ComfyUI/custom_nodes

# استنساخ المستودع
git clone https://github.com/ShmuelRonen/ComfyUI-NanoBanano.git

# تثبيت الاعتمادات
cd ComfyUI-NanoBanano
pip install -r requirements.txt

# إعادة تشغيل ComfyUI

أوضاع التشغيل المدعومة:

الوضع وصف الوظيفة سيناريو الاستخدام
generate توليد صور من النص إنشاء صور جديدة تماماً من الصفر
edit تعديل الصور تعديل أجزاء معينة من الصور الموجودة
style_transfer نقل النمط تطبيق نمط صورة ما على صورة أخرى
object_insertion إدراج كائن إدراج عناصر جديدة بدقة داخل الصورة

المميزات: وظائف أغنى، ودعم للعمليات متعددة الوسائط.
القيود: تتطلب صيانة وتحديث الإضافات يدوياً.

nano-banana-pro-sora-2-comfyui-integration-guide-ar 图示

1.3 منصات API الطرف الثالث (حلول المؤسسات)

بالنسبة لمستخدمي المؤسسات الذين يحتاجون إلى تزامن عالٍ، وزمن انتقال منخفض، وتحسين في التكاليف، توفر منصات API الخارجية حلولاً أفضل.

مقارنة الميزات الأساسية:

بُعد المقارنة Google API الرسمي منصة طرف ثالث (مثل APIYI)
تنسيق API Google AI Studio الأصلي متوافق مع تنسيق Google الأصلي
تعديل الكود لا يوجد يتطلب استبدال سطرين فقط
التكلفة أسعار قياسية تخفيض بنسبة 80% تقريباً
التوفر يعتمد على خوادم جوجل وصول محلي سريع، SLA بنسبة 99.9%
الدعم الفني دعم المجتمع فريق فني على مدار الساعة 7×24

مثال على التكوين (باستخدام APIYI كمثال):

# تكوين Google الرسمي الأصلي
api_endpoint = "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-exp:generateImage"
api_key = "YOUR_GOOGLE_API_KEY"

# الانتقال إلى منصة APIYI (يتطلب تعديل هذين السطرين فقط)
api_endpoint = "https://api.apiyi.com/v1/models/gemini-2.0-flash-exp:generateImage"
api_key = "YOUR_APIYI_API_KEY"  # احصل عليه من apiyi.com

🎯 نصيحة اختيار للمؤسسات: إذا كان فريقك يحتاج إلى معالجة كميات كبيرة من مهام توليد الصور في ComfyUI، فنحن نوصي بالربط عبر منصة APIYI (apiyi.com). توفر المنصة قنوات تسريع مخصصة ونظام دفع حسب الاستخدام، وهو ما يناسب تماماً بيئات الإنتاج التي تتجاوز حمولتها 1000 صورة يومياً.


2. Sora-2 في ComfyUI: تحليل الجدوى وخطة الإعداد

ردًا على السؤال الجوهري للعميل "Is it possible to use this video model in comfyUI?"، الإجابة هي: نعم، ولكن يجب ذلك عبر عقدة API.

2.1 المبدأ التقني لربط Sora-2 بـ ComfyUI

Sora-2 هو الجيل الثاني من نماذج توليد الفيديو التي أطلقتها OpenAI. وبخلاف نماذج الصور، لا يمكن نشر Sora-2 محليًا كما هو الحال مع Stable Diffusion. يجب أن يتم ربطه بـ ComfyUI عبر أحد المسارين التاليين:

طريقة الوصول التنفيذ التقني متطلبات الموارد الجدوى
تحميل النموذج محليًا تحميل ملفات الأوزان وتشغيلها محليًا ذاكرة فيديو (VRAM) > 80GB ❌ غير ممكن (OpenAI لم تفتحه للمصدر المفتوح)
استدعاء عقدة API استدعاء واجهة برمجة تطبيقات عن بُعد عبر طلبات HTTP يتطلب فقط اتصالاً بالإنترنت ومفتاح API ✅ ممكن (موصى به رسميًا)
بدائل مفتوحة المصدر استخدام نماذج مثل Open-Sora ذاكرة فيديو (VRAM) ≥ 16GB ✅ ممكن (وظائف محدودة)

الخلاصة: يجب ربط Sora-2 بـ ComfyUI عبر عقدة API، ولا يدعم النشر المحلي للنموذج.

2.2 دليل إعداد عقد Sora-2 API الرسمية

أصدرت ComfyUI رسميًا عقد "Sora-2 Partner Nodes"، والتي تدعم وضعي "نص إلى فيديو" و"صورة إلى فيديو".

خطوات التثبيت:

# الخطوة الأولى: تأكد أن إصدار ComfyUI ≥ v0.2.6
cd ComfyUI
git pull origin main

# الخطوة الثانية: أضف عقدة Sora-2 إلى سير العمل
# 1. انقر نقرًا مزدوجًا على اللوحة الفارغة
# 2. ابحث عن "OpenAI Sora" أو "Sora-2-i2v"
# 3. قم بتوصيل عقد الإدخال (الموجه النصي أو الصورة المرجعية)

إعدادات بارامترات عقدة Sora-2 Pro:

اسم البارامتر نوع البيانات الوصف القيمة الموصى بها
prompt String موجه وصفي للفيديو "A drone shot of a coastal city"
resolution Enum دقة الفيديو 1280x720 / 720x1280
duration Integer مدة الفيديو (بالثواني) 5-20 ثانية
input_image Image الصورة المرجعية (وضع i2v) يجب أن تطابق الدقة تمامًا
api_key String مفتاح OpenAI API sk-proj-...

ملاحظات هامة:

  • ⚠️ مطابقة الدقة: في وضع "صورة إلى فيديو"، يجب أن تكون الصورة المدخلة مطابقة تمامًا لدقة الفيديو المحددة، وإلا سيحدث خطأ.
  • ⚠️ التحكم في التكلفة: يتم محاسبة Sora-2 Pro بالثانية، فيديو مدته 20 ثانية يستهلك حوالي 0.50$ – 1.00$.
  • ⚠️ حصص API: تضع OpenAI قيودًا يومية على الحسابات الجديدة، لذا يجب تقديم طلب لزيادة الحصص مسبقًا.

nano-banana-pro-sora-2-comfyui-integration-guide-ar 图示

2.3 عقد Sora-2 API من طرف ثالث (حل Siray)

إلى جانب العقد الرسمية، يوفر المجتمع نسخًا محسنة تُعرف بـ "Sora-2 Custom Nodes".

مميزات عقد Siray OpenAI Sora-2-i2v:

# تثبيت عقد Siray المخصصة
cd ComfyUI/custom_nodes
git clone https://github.com/siray-comfyui/openai-sora-2.git
pip install -r openai-sora-2/requirements.txt

الوظائف المحسنة:

وحدة الوظائف العقد الرسمية عقد Siray شرح الميزة
توليد فيديو مجمع يدعم المعالجة التلقائية لقائمة الانتظار
توليد صوت متزامن يمكن توليد موسيقى خلفية في نفس الوقت
عرض شريط التقدم عرض مباشر لتقدم عملية التوليد
تخزين مؤقت محلي تقليل استدعاءات API المتكررة

🎯 نصيحة لسير العمل: بالنسبة للفرق التي تحتاج إلى إنتاج كميات كبيرة من فيديوهات التسويق، ننصح بدمج عقد المعالجة المسبقة في ComfyUI مع واجهة برمجة تطبيقات Sora-2 لبناء سير عمل مؤتمت. يمكن الحصول على واجهة Sora-2 API أكثر استقرارًا عبر منصة APIYI (apiyi.com)، وهي مناسبة جدًا لسيناريوهات توليد الفيديو المجمع، حيث توفر المنصة إدارة مخصصة لزمام الانتظار وحلولاً لتحسين التكلفة.


ثالثاً: أفضل الممارسات لسير العمل المختلط بين Nano Banana Pro وSora-2

تكمن قوة ComfyUI في القدرة على ربط عدة نماذج ذكاء اصطناعي (AI) معاً في سير عمل معقد. إليك عملية نموذجية لتحويل الصورة إلى فيديو (Image-to-Video):

3.1 تصميم هيكلية سير العمل المختلط

مخطط التدفق:

[موجه نصي]
    ↓
[عقدة Nano Banana Pro] ← توليد صورة غلاف عالية الجودة (4K)
    ↓
[عقدة المعالجة المسبقة للصور] ← تعديل الدقة إلى 1280x720
    ↓
[عقدة Sora-2 i2v] ← تحويل الصورة إلى فيديو مدته 10 ثوانٍ
    ↓
[عقدة المعالجة اللاحقة للفيديو] ← إضافة الانتقالات والمؤثرات الصوتية
    ↓
[المخرج النهائي] ← ملف فيديو MP4

مثال على تكوين العقد:

مرحلة سير العمل النموذج المستخدم المعلمات الأساسية وقت المعالجة
1. توليد الصورة Nano Banana Pro resolution=3840x2160, mode=generate 8-15 ثانية
2. تعديل الدقة ComfyUI مدمج target_size=1280x720, resize_mode=crop < 1 ثانية
3. توليد الفيديو Sora-2 Pro duration=10, motion_intensity=medium 60-120 ثانية
4. تصدير الفيديو عقدة FFmpeg codec=h264, bitrate=5000k 5-10 ثوانٍ

3.2 مثال لبرمجية سير العمل الفعلي

نسخة مبسطة من سير عمل ComfyUI بتنسيق JSON (العقد الأساسية):

{
  "nodes": [
    {
      "id": 1,
      "type": "TextInput",
      "properties": {
        "text": "A cyberpunk city with neon lights and flying cars"
      }
    },
    {
      "id": 2,
      "type": "GoogleGeminiImage",
      "properties": {
        "api_key": "YOUR_API_KEY",
        "prompt": "@1.text",
        "resolution": "3840x2160"
      }
    },
    {
      "id": 3,
      "type": "ImageResize",
      "properties": {
        "input": "@2.output",
        "target_size": "1280x720"
      }
    },
    {
      "id": 4,
      "type": "OpenAISora2",
      "properties": {
        "api_key": "YOUR_OPENAI_KEY",
        "input_image": "@3.output",
        "duration": 10
      }
    }
  ]
}
انقر لتوسيع إعدادات سير العمل الكاملة (تتضمن معلمات متقدمة)
{
  "version": "1.0",
  "workflow_name": "Nano_Banana_to_Sora2_Video",
  "nodes": [
    {
      "id": 1,
      "type": "TextInput",
      "properties": {
        "text": "A cyberpunk city with neon lights and flying cars",
        "negative_prompt": "blurry, low quality, distorted"
      }
    },
    {
      "id": 2,
      "type": "GoogleGeminiImage",
      "properties": {
        "api_key": "YOUR_API_KEY",
        "api_endpoint": "https://api.apiyi.com/v1/models/gemini-2.0-flash-exp:generateImage",
        "prompt": "@1.text",
        "negative_prompt": "@1.negative_prompt",
        "resolution": "3840x2160",
        "aspect_ratio": "16:9",
        "guidance_scale": 7.5,
        "num_inference_steps": 30
      }
    },
    {
      "id": 3,
      "type": "ImageResize",
      "properties": {
        "input": "@2.output",
        "target_size": "1280x720",
        "resize_mode": "crop_center",
        "interpolation": "lanczos"
      }
    },
    {
      "id": 4,
      "type": "OpenAISora2Pro",
      "properties": {
        "api_key": "YOUR_OPENAI_KEY",
        "input_image": "@3.output",
        "prompt": "@1.text",
        "duration": 10,
        "resolution": "1280x720",
        "motion_intensity": "medium",
        "camera_motion": "pan_right",
        "frame_rate": 30
      }
    },
    {
      "id": 5,
      "type": "VideoExport",
      "properties": {
        "input": "@4.output",
        "format": "mp4",
        "codec": "h264",
        "bitrate": "5000k",
        "output_path": "./outputs/final_video.mp4"
      }
    }
  ],
  "connections": [
    {"from": 1, "to": 2, "type": "text"},
    {"from": 2, "to": 3, "type": "image"},
    {"from": 3, "to": 4, "type": "image"},
    {"from": 4, "to": 5, "type": "video"}
  ]
}

🎯 نصيحة لتحسين الأداء: عند التعامل مع المهام الدفعية (batch tasks)، نوصي بفصل استدعاءات API لكل من Nano Banana Pro وSora-2 في طوابير انتظار مختلفة. من خلال خاصية موازنة الأحمال في منصة APIYI (apiyi.com)، يمكنك معالجة توليد الصور وتوليد الفيديو بشكل متوازٍ، مما يرفع كفاءة سير العمل الإجمالية بنسبة 40% تقريباً.


رابعاً: الأسئلة الشائعة (FAQ)

س1: هل يمكن تشغيل Nano Banana Pro وSora-2 محلياً بالكامل؟

Nano Banana Pro: ❌ لا يدعم النشر المحلي، يجب استخدامه عبر استدعاء واجهة برمجة التطبيقات (API).
Sora-2: ❌ لا يدعم النشر المحلي، حيث لم تقم OpenAI بفتح مصدر أوزان النموذج.
البدائل: يمكنك استخدام Stable Diffusion (للصور) وOpen-Sora (للفيديو) مفتوحة المصدر للتشغيل المحلي.

س2: كيف يمكن تقليل تكلفة استدعاء واجهة برمجة تطبيقات (API) الخاصة بـ Sora-2؟

استراتيجية التحسين مقدار خفض التكلفة صعوبة التنفيذ
تقصير مدة الفيديو (من 10 إلى 5 ثوانٍ) 50% ⭐ بسيطة
استخدام دقة منخفضة (من 720p إلى 480p) 30% ⭐ بسيطة
الاستدعاء المجمع للحصول على خصومات 15-20% ⭐⭐ متوسطة
استخدام منصات API طرف ثالث 20-40% ⭐⭐ متوسطة

🎯 نصيحة لإدارة التكاليف: للمستخدمين الذين يتجاوز استهلاكهم الشهري 500 دولار، ننصح بالاشتراك في باقات الشركات عبر منصة APIYI (apiyi.com). توفر المنصة أسعاراً متدرجة وخصومات مسبقة الدفع، كما تدعم إدارة الفواتير الموحدة لكل من Nano Banana Pro وSora-2 لتسهيل الإجراءات المالية.

س3: هل دقة الفيديو الناتج من Sora-2 في ComfyUI محدودة؟

نسخة Sora-2 القياسية:

  • ✅ تدعم: 720×1280, 1280×720
  • ❌ لا تدعم: 1080p, 4K

نسخة Sora-2 Pro:

  • ✅ تدعم: 720×1280, 1280×720, 1024×1792, 1792×1024
  • ❌ لا تدعم: الدقة المخصصة

الحل: استخدم عقدة الدقة الفائقة (مثل ESRGAN) في ComfyUI لتكبير فيديو 720p إلى 1080p أو 4K.

س4: كيف يتم نقل الصورة المولدة من Nano Banana Pro تلقائياً إلى Sora-2؟

في سير عمل ComfyUI، يجب الانتباه إلى النقاط الرئيسية التالية:

# مثال خاطئ: التوصيل المباشر سيؤدي إلى عدم تطابق الدقة
[Nano Banana Pro] → [Sora-2 i2v]  # ❌ قد يظهر خطأ

# مثال صحيح: إضافة عقدة تحويل الدقة في المنتصف
[Nano Banana Pro] → [Image Resize] → [Sora-2 i2v]  # ✅ ممارسة موصى بها

جدول مطابقة الدقة:

مخرجات Nano Banana Pro هل تحتاج تعديل؟ متطلبات مدخلات Sora-2
3840×2160 (4K) ✅ Resize (تغيير الحجم) 1280×720
1920×1080 (1080p) ✅ Crop+Resize (قص وتعديل) 1280×720
1280×720 (720p) ❌ استخدام مباشر 1280×720

س5: ما هي إصدارات ComfyUI التي تدعم هذه النماذج الجديدة؟

النموذج الحد الأدنى لإصدار ComfyUI الإصدار الموصى به طريقة الحصول عليه
Nano Banana Pro (العقدة الرسمية) v0.2.3 v0.2.7+ (nightly) git pull origin main
Sora-2 (العقدة الرسمية) v0.2.6 v0.2.8+ (nightly) كما في الأعلى
العقد المخصصة لا يوجد قيود أحدث إصدار مستقر تثبيت الإضافات يدوياً

5. الخلاصة وتوصيات الاختيار

5.1 مراجعة الإجابات على الأسئلة الجوهرية

س: ما هو أبسط تكوين لربط Nano Banana Pro API بـ ComfyUI؟
ج: استخدم "عُقد الشركاء" (Partner Nodes) الرسمية، فالأمر يتطلب ثلاث خطوات فقط:

  1. تحديث ComfyUI إلى إصدار nightly.
  2. البحث عن عقدة "Google Gemini Image" وإضافتها.
  3. إدخال مفتاح الـ API والموجه (Prompt) للبدء في الاستخدام.

س: هل يمكن ربط نموذج الفيديو Sora-2 بـ ComfyUI؟
ج: نعم، ولكن يجب أن يتم ذلك عبر عُقد API، حيث لا يُدعم نشر النموذج محلياً. توفر الجهات الرسمية والمطورون المستقلون عُقداً مخصصة (Custom Nodes) جاهزة لـ Sora-2.

5.2 توصيات الاختيار حسب سيناريوهات الاستخدام المختلفة

سيناريو الاستخدام الخيار الموصى به السبب
التعلم والاختبار الشخصي عُقد الشركاء الرسمية رصيد مجاني، إعدادات بسيطة
الاستوديوهات الصغيرة (أقل من 100 صورة/يوم) عُقد مخصصة + API رسمي ميزات غنية، تكلفة قابلة للتحكم
بيئة الإنتاج للمؤسسات منصات API طرف ثالث (مثل APIYI) موثوقية عالية، تحسين التكاليف، دعم فني
النشر الخاص دون اتصال بالإنترنت البدائل مفتوحة المصدر (Stable Diffusion + Open-Sora) أمن البيانات، عدم الاعتماد على شبكة الإنترنت

🎯 التوصية النهائية: بالنسبة للمستخدمين الذين يحتاجون لاستخدام Nano Banana Pro وSora-2 في آن واحد، ننصح بإدارة طلبات الـ API بشكل موحد عبر منصة APIYI (apiyi.com). تدعم هذه المنصة الوصول إلى كلا النموذجين باستخدام مفتاح API واحد، مما يبسط عملية إدارة المفاتيح، ويوفر لوحة مراقبة موحدة وأدوات لتحليل التكاليف. تفضل بزيارة apiyi.com الآن لتسجيل حسابك، حيث يحصل المستخدمون الجدد على رصيد مجاني بقيمة 20 دولاراً أمريكياً لاختبار سير العمل.

5.3 موارد تعليمية إضافية

وثائق رسمية:

  • وثائق ComfyUI الرسمية: docs.comfy.org/tutorials/partner-nodes
  • مرجع Nano Banana Pro API: ai.google.dev/gemini-api
  • وثائق Sora-2 API: platform.openai.com/docs/guides/sora

موارد المجتمع:

  • مشاركة سير عمل ComfyUI: comfyui.org/workflows
  • مجموعة العُقد المخصصة على GitHub: github.com/ComfyUI-Workflow/awesome-comfyui

دروس فيديو:

  • "دليل ComfyUI Nano Banana Pro الشامل" – YouTube
  • "عرض عملي لعُقد Sora-2 API" – Bilibili

من خلال هذا الشرح المفصل، أصبحت تمتلك الآن المعرفة الكاملة لكيفية ربط Nano Banana Pro وSora-2 بـ ComfyUI. وسواء اخترت سهولة العُقد الرسمية، أو مرونة العُقد المخصصة، أو الخدمات الاحترافية لمنصات الطرف الثالث، يمكنك الاختيار بمرونة وفقاً لاحتياجاتك الفعلية.

افتح ComfyUI الآن، وابدأ رحلتك في الإبداع باستخدام الذكاء الاصطناعي!

قراءات مقترحة:

  • "دليل ComfyUI المتقدم: بناء سير عمل مؤتمت لتوليد الفيديو"
  • "مقارنة بين Nano Banana Pro وMidjourney: نماذج توليد الصور للمؤسسات"
  • "استراتيجية تحسين تكلفة Sora-2 API: كيف تخفض تكاليف توليد الفيديو بنسبة 70%"

موضوعات ذات صلة