هل ترغب في استدعاء نموذج gpt-image-2 مباشرة داخل ComfyUI محلياً للقيام بمهام تحويل النص إلى صورة، وتعديل الأقنعة (Mask)، ودمج الصور، لكنك تواجه عقبات تتعلق ببيئة الشبكة، أو حصص الاستخدام، أو التحكم في المعاملات عبر عقد OpenAI الرسمية؟ في هذا المقال، سنوضح لك أقصر مسار لتنفيذ هذه العملية بالكامل: تثبيت إضافة مجتمعية، واستخدام خدمة وكيل API، وتفعيل عقدة gpt-image-2 في ComfyUI خلال 5 دقائق فقط.
يُعد gpt-image-2 نموذجاً متطوراً أطلقته OpenAI في عام 2026 يعتمد على مبدأ "الاستنتاج قبل التوليد"، وهو متميز جداً في تنسيق النصوص الكثيفة، وتصميم الرسوم البيانية لواجهات المستخدم، ورسم القصص المصورة، والتعديل الدقيق للأقنعة مع الحفاظ على استقرار البكسلات في المناطق غير المعدلة. ومع ذلك، فإن دمج هذا النموذج في مخطط عقد ComfyUI قد يكون صعباً للمستخدمين في العديد من المناطق بسبب قيود العقد الرسمية (Partner Nodes)، حيث يضطرون غالباً لاستخدام Comfy Cloud أو يواجهون مشاكل في التحقق.
تعتبر إضافة Comfyui-Luck-gpt2.0 حالياً أكثر حلول ربط gpt-image-2 استقراراً في مجتمع ComfyUI، حيث توفر عقدتين: واحدة للتحكم الدقيق (Fine Control) وأخرى للإنتاج الاقتصادي والكمي (Economic Batch)، مما يتيح لك الحصول على مخرجات عالية الجودة بدقة 4K أو إنتاج مسودات بتكلفة منخفضة تصل إلى 0.03 دولار للصورة. للعمل، يحتاج الطرف الخلفي فقط إلى الاتصال بخدمة وكيل API متوافقة مع واجهة OpenAI. نوصي هنا باستخدام APIYI عبر موقع apiyi.com، حيث يوفر ثلاث مسارات (api.apiyi.com / vip.apiyi.com / b.apiyi.com) مع دعم فوري لمفاتيح Bearer Token.
بعد اتباع هذا الدليل حول ربط ComfyUI مع gpt-image-2، ستحصل على:
- عقدة
Luck gpt-image-2/Luck gpt-2.0 allالتي يمكنك العثور عليها بمجرد النقر المزدوج في ComfyUI. - دليل سريع للمعاملات يغطي دقات 1K/2K/4K، و15 نسبة عرض إلى ارتفاع، وتعديل الأقنعة.
- نموذجين جاهزين لسير العمل (تحويل النص إلى صورة بدقة 4K + إعادة رسم الأجزاء باستخدام القناع).
- قائمة بالأخطاء الشائعة لتجنب مشاكل انتهاء المهلة (Timeout)، وخطأ 429، وتنسيقات الأقنعة.

一、为什么要在 ComfyUI 里接入 gpt-image-2
1.1 gpt-image-2 带给 ComfyUI 的三个新能力
在 gpt-image-2 之前,ComfyUI 画布上做文本海报、UI 信息图基本靠 SDXL + ControlNet 硬拼,成品经常糊字、排版走形。gpt-image-2 是 OpenAI 第一个"生成前先推理"的图像模型,它会先规划构图再落笔,适配 ComfyUI 这种需要与其他节点协同工作的场景:
| 能力 | 之前的本地方案 | 接入 gpt-image-2 之后 |
|---|---|---|
| 密集文本渲染 | 需要 OCR 后期修补 | 直接生成"7 项 11pt Helvetica 居中列表"级排版 |
| Mask 局部重绘 | Inpaint 常破坏周边像素 | 编辑区外"像素稳定",不伤脸、不改构图 |
| 多图参考一致性 | IPAdapter 调参复杂 | 最多 5 张参考图,直接保持角色/商品一致 |
| 超高分辨率 | Hires.fix 反复折腾 | 原生支持 1K/2K/4K 一次出图 |
1.2 为什么选 Comfyui-Luck-gpt2.0 而不是官方节点
ComfyUI 官方在 v0.19.4 通过 Partner Nodes 加入了 OpenAI GPT-Image 节点,但它默认走 OpenAI 直连,在国内或带外网络受限的环境里经常卡在 SSL 握手或 429 限流。Comfyui-Luck-gpt2.0 的价值就在这里:
- ✅ 国内友好:默认对接兼容 OpenAI 接口的服务,主站
api.apiyi.com+ 双备份 - ✅ 参数更全:比官方节点多暴露
image_size/quality/output_compression/output_format等精细参数 - ✅ 双节点组合:既有"精细控制"的正转节点,也有"按张计费"的经济反转节点
- ✅ 中文 prompt:反转节点对中文语义理解更稳定
💡 网关建议:本文全程使用 APIYI
apiyi.com作为 gpt-image-2 的接入入口。它同时支持 Responses API 格式和 Images API 格式,恰好对应 Comfyui-Luck-gpt2.0 的两种节点端点,省去二次适配。
1.3 本教程适合谁
| 你的角色 | 你会从本教程得到 |
|---|---|
| ComfyUI 老玩家 | 在现有工作流里插入一个高质量"封面/海报"节点,省掉 Photoshop 二次修字 |
| AIGC 商拍师 | Mask 精修 + 多参考图,稳定复刻商品/模特一致性 |
| 自媒体/博主 | 4K 竖版 2:3 封面一键出图,替代外部图库 |
| 开发者 | 把 ComfyUI 当本地 Stable Diffusion 壳,用 gpt-image-2 做 API 测试集成 |
二、ComfyUI 接入 gpt-image-2 的核心组件

2.1 Comfyui-Luck-gpt2.0 插件一览
Comfyui-Luck-gpt2.0 是一个开源的 ComfyUI 自定义节点包,GitHub 仓库位于 github.com/luckdvr/Comfyui-Luck-gpt2.0。它不是一个单一节点,而是一个"套件"——安装后会在 ComfyUI 节点菜单里同时注册两个独立节点:
Comfyui-Luck-gpt2.0
├── Luck gpt-image-2 # 正转节点:精细控制,真 size 参数
└── Luck gpt-2.0 all # 反转节点:经济模式,端点可切换
两个节点的对外接口一致,都要求你提供:
- 一个兼容 OpenAI 协议的
base_url(推荐 APIYIapi.apiyi.com) - 一个
Bearer YOUR_API_KEY格式的 token - 文字 prompt 或图像输入
2.2 两个节点怎么选:一张表说清楚
这是全文最重要的一张表,先看懂它再往下走:
| 对比维度 | Luck gpt-image-2(正转) | Luck gpt-2.0 all(反转) |
|---|---|---|
| 后端模型 | gpt-image-2 |
gpt-image-2-all |
| 定位 | 精细控制、高质量出图 | 经济批量、中文友好 |
| size 参数 | ✅ 真实 size 字段 |
❌ 仅通过 prompt 暗示 |
| 分辨率档位 | AUTO / 1K / 2K / 4K / 自定义 | 默认尺寸 |
| 宽高比 | 15 种预设 + 自定义 WxH | 通过 prompt 表述 |
| Mask 局部重绘 | ✅ 支持 | ❌ 不支持 |
| 参考图数量 | 最多 5 张 | 最多 5 张 |
| quality 档位 | auto / low / medium / high | 固定 |
| 输出格式 | PNG / JPEG / WebP | PNG |
| 端点切换 | images_api 固定 |
chat_completions / images_api 可切换 |
| 参考价位 | 按 token 计费 | 约 $0.03/图 |
| 适合场景 | 海报、封面、商拍、Mask 精修 | 批量草图、概念稿、中文 prompt |

2.3 API 后端:为什么推荐 APIYI apiyi.com
Comfyui-Luck-gpt2.0 本身是"空壳",真正调用 gpt-image-2 的是你在 base_url 里填的网关。它期望网关满足两点:
- 完全兼容 OpenAI 协议:
/v1/images/generations、/v1/responses、/v1/chat/completions路由齐全 - 对 gpt-image-2 有原生路由:能识别
model=gpt-image-2和model=gpt-image-2-all
🎯 接入建议:我们建议通过 APIYI apiyi.com 平台接入 gpt-image-2。该平台同时支持 gpt-image-2 正转模式和 gpt-image-2-all 反转模式,使用统一的 Bearer Token 认证,主站
api.apiyi.com与备用线路vip.apiyi.com/b.apiyi.com自动切换,大幅降低 ComfyUI 跑批时因单一出口抖动导致的失败率。
不同域名的适用场景如下:
| 域名 | 定位 | 适用场景 |
|---|---|---|
api.apiyi.com |
主站 | 默认首选,ComfyUI 个人工作站日常调用 |
vip.apiyi.com |
高并发线路 | 批量跑图、多节点并行、夜间队列 |
b.apiyi.com |
备用出口 | 主站波动时的自动 fallback |
三条线路共用一套 API Key,你在 Comfyui-Luck-gpt2.0 节点里只需要改一个字符串就能切换。
ثالثاً. خطوات التثبيت الكاملة لربط ComfyUI مع gpt-image-2
3.1 فحص المتطلبات الأساسية للبيئة
قبل البدء، تأكد من أن بيئة ComfyUI لديك تلبي المتطلبات التالية:
| العنصر | المتطلبات | أمر الفحص |
|---|---|---|
| إصدار ComfyUI | يوصى بـ v0.3+ أو أحدث | السطر الأول في وحدة التحكم عند التشغيل |
| إصدار Python | 3.10 / 3.11 / 3.12 | python3 --version |
| Git متاح | يمكن استدعاؤه مباشرة من الطرفية | git --version |
| مساحة القرص | ≥ 500 ميجابايت (للإضافة والتبعيات) | df -h |
| الشبكة | الوصول إلى GitHub و api.apiyi.com |
curl -I api.apiyi.com |
⚠️ مشاكل شائعة: إذا كنت من مستخدمي Windows وتستخدم حزمة التثبيت بضغطة واحدة (مثل إصدار Qiuye)، فقد يشير
python3إلى نسخة Python المدمجة، لذا ستحتاج إلى استخدام.\python_embeded\python.exeبدلاً منه.
3.2 تثبيت الإضافة: 4 خطوات فقط
تتطلب عملية ربط ComfyUI مع gpt-image-2 تنفيذ 4 أوامر فقط. افتح الطرفية (Terminal)، وانتقل إلى المجلد الرئيسي لـ ComfyUI ثم نفذ ما يلي:
# 1. الانتقال إلى مجلد custom_nodes
cd ComfyUI/custom_nodes
# 2. استنساخ مستودع Comfyui-Luck-gpt2.0
git clone https://github.com/luckdvr/Comfyui-Luck-gpt2.0.git
# 3. تثبيت تبعيات Python
cd Comfyui-Luck-gpt2.0
python3 -m pip install -r requirements.txt
# 4. إعادة تشغيل ComfyUI
بالنسبة لمستخدمي حزمة Windows المدمجة، استبدل الخطوة الثالثة بـ:
cd Comfyui-Luck-gpt2.0
..\..\python_embeded\python.exe -m pip install -r requirements.txt
بعد إعادة التشغيل، راقب وحدة التحكم للتأكد من ظهور سجلات مشابهة لما يلي:
[Comfyui-Luck-gpt2.0] Registered node: Luck gpt-image-2
[Comfyui-Luck-gpt2.0] Registered node: Luck gpt-2.0 all
إذا رأيت سطرين يشيران إلى التسجيل بنجاح، فهذا يعني أن خطوة ربط ComfyUI مع gpt-image-2 قد تمت بنجاح.
3.3 الحصول على مفتاح API من APIYI
- افتح المتصفح وقم بزيارة الموقع الرسمي لـ APIYI على
apiyi.com. - بعد التسجيل/تسجيل الدخول، انتقل إلى لوحة التحكم → API Keys.
- انقر على "إنشاء مفتاح جديد" (New Key)، ويوصى بتفعيل "حد الاستخدام" (Usage Limit)، ولأول مرة يمكنك ضبط الرصيد على 20-50 يوان للتحقق.
- انسخ سلسلة المفتاح التي تبدأ بـ
sk-واحفظها في مكان آمن.
🔐 نصيحة أمنية: قم بإنشاء مفتاح مخصص لـ ComfyUI، واضبط حدًا أقصى للاستخدام اليومي. تقوم الإضافات المحلية بكتابة المفتاح في معلمات العقدة، مما قد يؤدي إلى تسريبه عند تصدير سير العمل بصيغة JSON، لذا فإن استخدام مفتاح مستقل يسهل إلغاءه لاحقًا.
3.4 إدراج العقدة في لوحة ComfyUI
بعد فتح ComfyUI:
- انقر نقرًا مزدوجًا في أي مساحة فارغة على اللوحة لفتح مربع البحث عن العقد.
- اكتب
Luck gpt-image-2(للتحويل المباشر) أوLuck gpt-2.0 all(للتحويل العكسي). - اختر العقدة، وسيقوم ComfyUI بوضعها في مكان مؤشر الماوس.
بعد ظهور العقدة، املأ الحقول الثلاثة الرئيسية:
| الحقل | القيمة | ملاحظات |
|---|---|---|
base_url |
https://api.apiyi.com/v1 |
عنوان الموقع الرئيسي (تأكد من وجود /v1) |
api_key |
sk-xxxxxxxxxxxxxxxx |
المفتاح المنسوخ من لوحة تحكم APIYI |
model |
gpt-image-2 أو gpt-image-2-all |
يعتمد على العقدة، وعادة ما يتم ملؤه تلقائيًا |
3.5 أول عملية توليد: الحد الأدنى لسير العمل القابل للتشغيل
لنستخدم Luck gpt-image-2 لتوليد صورة 1024×1024 (تحويل النص إلى صورة) للتحقق من سلامة الاتصال:
[Luck gpt-image-2]
├── base_url = https://api.apiyi.com/v1
├── api_key = sk-xxxxxxxx
├── prompt = ملصق منتج بسيط، خلفية زرقاء داكنة،
│ عنوان في المنتصف "HELLO 2026" بخط Helvetica كبير،
│ نجوم صغيرة متناثرة في الخلفية
├── image_size = 1K
├── aspect_ratio = 1:1
├── quality = medium
└── output_format = png
│
▼
[Preview Image]
قم بتوصيل مخرج image الخاص بعقدة Luck gpt-image-2 بعقدة Preview Image المدمجة في ComfyUI، ثم اضغط على Queue. بعد حوالي 20-40 ثانية، ستظهر صورة مربعة على يمين اللوحة تحمل عنوان "HELLO 2026" بشكل جميل. إذا كان النص واضحًا والتنسيق في المنتصف، فهذا يعني أنك نجحت في ربط gpt-image-2 داخل ComfyUI.
🎯 تأكيد النجاح: إذا فشلت هذه الخطوة، ففي 90% من الحالات يكون السبب هو نسيان
/v1فيbase_urlأو عدم إضافةsk-قبل المفتاح. عد إلى لوحة تحكم APIYI وانسخ المفتاح مرة أخرى، ثم تحقق من نهايةbase_url.
رابعاً. دليل المعلمات الأساسية لـ gpt-image-2 في ComfyUI
4.1 الدقة (image_size)
يحدد حقل image_size في عقدة Luck gpt-image-2 مستوى دقة المخرجات:
| image_size | الحجم الفعلي (مثال 1:1) | الاستخدام النموذجي |
|---|---|---|
| AUTO | تحديد تلقائي بواسطة النموذج | للاستكشاف دون تحديد حجم معين |
| 1K | 1024×1024 | مسودات، صور شخصية، ملصقات |
| 2K | 2048×2048 | صور المقالات، أغلفة المدونات |
| 4K | حتى 3840×3840 | ملصقات، طباعة، شاشات عرض كبيرة |
| custom | WIDTHxHEIGHT | إعلانات بأحجام خاصة، صور طولية |
متطلبات وضع custom:
- يجب أن يكون العرض والارتفاع من مضاعفات 16.
- يجب ألا يتجاوز الضلع الأكبر 3840 بكسل.
- الصيغة الموصى بها:
1600x900،2048x1152،1088x1920.
4.2 نسب العرض إلى الارتفاع (aspect_ratio)
تدعم عقدة gpt-image-2 15 نسبة مسبقة، وهذه هي الثمانية الأكثر استخدامًا:
| aspect_ratio | سيناريو الاستخدام |
|---|---|
| 1:1 | صور شخصية، صور مربعة لوسائل التواصل |
| 16:9 | أغلفة المدونات، أغلفة فيديوهات Bilibili |
| 9:16 | قصص (Stories) تيك توك/إنستغرام، خلفيات هاتف |
| 2:3 | ملصقات الأفلام، Pinterest |
| 3:2 | عرض تصوير فوتوغرافي |
| 4:3 | شرائح العرض (PPT) |
| 21:9 | لافتات عريضة، أغلفة مواقع إلكترونية |
| 4:5 | أفضل نسبة للنشر على إنستغرام |
4.3 مستويات الجودة (quality)
| quality | السرعة | التكلفة | سيناريو الاستخدام |
|---|---|---|---|
| auto | متوسطة | متوسطة | اترك القرار للنموذج |
| low | سريعة | منخفضة | مسودات، معاينة الأجواء |
| medium | متوسطة | متوسطة | صور المدونات اليومية، التواصل الاجتماعي |
| high | بطيئة | عالية | أغلفة، ملصقات، مواد مطبوعة |
قاعدة عامة: عند استخدام نسب عرض إلى ارتفاع عالية (21:9) أو دقة عالية (4K)، استخدم quality=high لضمان عدم ضياع التفاصيل.
4.4 تنسيق المخرجات والضغط
| output_format | output_compression | الاستخدام |
|---|---|---|
| png | تجاهل | خلفيات شفافة، تعديلات لاحقة |
| jpeg | 85–95 | صور المقالات |
| webp | 75–85 | المواقع الإلكترونية، تطبيقات الجوال |
يعمل output_compression فقط في وضعي jpeg/webp، بقيم تتراوح بين 0-100؛ كلما زاد الرقم، زاد حجم الملف وتحسنت الجودة.
4.5 الصورة المرجعية (Reference Image) والقناع (Mask)
- الصورة المرجعية: يمكنك توصيل ما يصل إلى 5 صور كمدخلات
IMAGE. سيعتمدها النموذج كنقاط مرجعية للتكوين أو الأسلوب أو الشخصية. - القناع (Mask): قم بتوصيل صورة بالأبيض والأسود بنفس أبعاد الصورة المرجعية الأولى تمامًا؛ البكسلات البيضاء تعني "قم بالتعديل هنا"، والبكسلات السوداء تعني "حافظ على استقرار البكسل". هذه واحدة من أقوى قدرات gpt-image-2.
🎯 نصيحة عملية: استخدم عقدة
LoadImageفي ComfyUI لتحميل الصورة الأصلية، ثم استخدمMaskToImage/ImageInvertلإنشاء القناع. إذا كان سير العمل معقدًا، يمكنك الرجوع إلى سير العمل النموذجي لـ gpt-image-2 في وثائق APIYI الرسميةdocs.apiyi.comحيث يمكنك نسخه ولصقه مباشرة.
5. ثلاثة نماذج عمل عملية لدمج gpt-image-2 في ComfyUI
5.1 نموذج العمل أ: توليد ملصقات (بوسترات) عالية الجودة بدقة 4K
الهدف: توليد غلاف لملصق فيلم بدقة 3840×5760 (بنسبة عرض إلى ارتفاع 2:3)، مع نصوص واضحة وتكوين مركزي.
[PrimitiveNode: سلسلة نصية للموجه]
│
▼
[Luck gpt-image-2]
├── base_url = https://api.apiyi.com/v1
├── api_key = sk-xxxx
├── prompt = (من العقدة السابقة)
├── image_size = 4K
├── aspect_ratio = 2:3
├── quality = high
├── output_format = png
├── timeout = 360
└── max_retries = 3
│
▼
[SaveImage: filename_prefix = poster_4k]
مثال على الموجه (Prompt):
A cinematic poster for a sci-fi novel titled "NEON HORIZON",
dark blue and magenta gradient sky, lone silhouette standing on a cliff,
bold serif title centered at the top, subtle tagline at bottom in small caps,
highly detailed, 35mm film grain.
نقاط رئيسية:
image_size=4K+aspect_ratio=2:3≈ 3840×5760- إعداد
quality=highضروري جداً لوضوح النص، حيث قد تظهر تشوهات في الحروف عند الإعدادات المنخفضة. - يجب أن يكون
timeout≥ 360 ثانية، لأن توليد صور 4K قد يستغرق من 3 إلى 5 دقائق.
5.2 نموذج العمل ب: إعادة التلوين الجزئي باستخدام القناع (تغيير الخلفية/تعديل التفاصيل)
الهدف: تغيير الخلفية البيضاء لصورة كوب قهوة إلى "سطح طاولة رخامي"، مع الحفاظ على كوب القهوة والظلال في المقدمة دون تغيير.
[LoadImage: coffee_cup.png] [LoadImage: coffee_cup_mask.png]
│ │
▼ ▼
[Luck gpt-image-2]
├── prompt = Replace the background with a luxurious
│ white marble countertop, soft natural
│ window light from the left
├── image_1 = ← coffee_cup.png
├── mask = ← coffee_cup.png_mask (أبيض=منطقة الخلفية)
├── image_size = 2K
├── quality = high
│
▼
[SaveImage]
قواعد القناع (Mask) الأساسية:
- يجب أن تتطابق أبعاد صورة القناع تماماً مع أبعاد
image_1. - اللون الأبيض (255,255,255) = المنطقة المراد تعديلها.
- اللون الأسود (0,0,0) = المنطقة المراد الحفاظ على ثباتها.
- التدرج الرمادي = مزج نسبي (يمكن استخدامه لتنعيم الحواف).
💡 نصيحة للحفاظ على الدقة: استخدم تمويهاً غاوسياً (Gaussian Blur) بمقدار 3-5 بكسل على حواف القناع لتجنب ظهور فواصل تشبه "الملصقات". نموذج gpt-image-2 يتعامل بشكل جيد مع التدرجات الرمادية، مما يجعله مثالياً لاستبدال خلفيات صور المنتجات.
5.3 نموذج العمل ج: وضع اقتصادي لتوليد 100 مسودة مفهوم (Concept)
الهدف: تصميم 100 زي لشخصية، بتكلفة تقريبية 0.03 دولار لكل صورة، مع ضبط التكلفة الإجمالية عند حوالي 3 دولارات.
[TextFileReader: 100 موجه]
│
▼ (دورة/طابور)
[Luck gpt-2.0 all]
├── base_url = https://vip.apiyi.com/v1 ← مسار مخصص للطلبات الكثيفة
├── api_key = sk-xxxx
├── endpoint = chat_completions
├── model = gpt-image-2-all
├── timeout = 180
└── max_retries = 3
│
▼
[SaveImage: filename_prefix = concept_###]
ثلاثة أسباب تجعل عقدة Luck gpt-2.0 all مثالية لهذا السيناريو:
- المحاسبة لكل صورة: حوالي 0.03 دولار للصورة، مما يسهل تقدير الميزانية مقارنة بالمحاسبة بناءً على الرموز (Tokens).
- دعم الموجهات باللغة العربية: غالباً ما تتطلب مسودات المفاهيم مصطلحات مثل "زي هانفو مطور" أو "سايبر بانك"، وتوفر العقدة استقراراً أعلى في التعامل معها.
- تبديل نقاط النهاية: وضع
chat_completionsيوفر توافقاً أفضل مع الموجهات الطويلة.
🎯 استقرار العمليات الجماعية: عند التشغيل الجماعي، قم بتغيير
base_urlإلىvip.apiyi.comواضبطmax_retriesعلى 3 وtimeoutعلى 180 ثانية. مسار VIP الخاص بـ APIYI يقوم تلقائياً بتوزيع الأحمال في حال حدوث تقلبات قصيرة المدى (مثل أخطاء 429/5xx)، مما يقلل من احتمالية توقف المهام الطويلة.
6. تقنيات متقدمة لدمج gpt-image-2 في ComfyUI
6.1 خط الإنتاج الهجين: gpt-image-2 لتوليد الهيكل + النماذج المحلية للأسلوب
يتميز gpt-image-2 في "التكوين المعقد + تنسيق النصوص"، لكنه قد لا يتفوق على SDXL / Flux في أنماط الأنمي أو فن البكسل. خط الإنتاج الموصى به:
[Luck gpt-image-2] → توليد الهيكل الأساسي (مع نصوص وشعارات)
↓
[VAE Encode] → التحويل إلى فضاء كامن (latent)
↓
[KSampler: Flux/SDXL + LoRA] → نقل الأسلوب / تحسين الوضوح
↓
[Upscaler: 4x-UltraSharp] → رفع الدقة إلى 8K
هذا النهج يستفيد من قدرة gpt-image-2 على "كتابة النصوص" وحرية النماذج المحلية في "تحديد الأسلوب".
6.2 اتساق الوجوه (صور مرجعية متعددة): الحفاظ على ثبات المنتج/الشخصية
تفعيل مدخلات الصور المرجعية الخمس في Luck gpt-image-2 يمكن أن يعزز بشكل كبير من اتساق الشخصية أو المنتج:
| موقع الصورة المرجعية | المحتوى المقترح |
|---|---|
| image_1 | صورة واضحة للوجه الأمامي |
| image_2 | صورة جانبية/خلفية |
| image_3 | لقطة تفصيلية (شعار، نسيج) |
| image_4 | مرجع لأجواء المشهد |
| image_5 | مرجع للألوان/الإضاءة |
6.3 الاتساق الجماعي: توليد 8 صور متسلسلة في وقت واحد
يمكن لـ gpt-image-2 إرجاع ما يصل إلى 8 صور تحافظ على اتساق الموضوع في المرة الواحدة. اضبط المعامل n (يسمى أحياناً batch_size) على 8 في عقدة Luck gpt-image-2.
6.4 عرض سير عمل ComfyUI كـ API
إذا كنت تستخدم ComfyUI كـ "خادم خاص" للتطبيقات الأمامية، يمكن استهلاك مخرجات عقدة Comfyui-Luck-gpt2.0 مباشرة عبر واجهة /prompt في ComfyUI. من خلال دمج مسارات APIYI المتعددة كخلفية، يصبح المسار كالتالي:
واجهتك الأمامية → ComfyUI HTTP API → عقدة Luck gpt-image-2
↓
api.apiyi.com / vip.apiyi.com
↓
OpenAI gpt-image-2
هذا هو أسرع طريق لتحويل "سير عمل ComfyUI" إلى "API صور خارجي".
سابعاً: الأسئلة الشائعة (FAQ) حول دمج gpt-image-2 في ComfyUI
س1: لقد قمت بتثبيت العقدة (Node)، لكنني لا أجد Luck gpt-image-2 في لوحة الرسم؟
تحقق من أربعة أمور:
- تأكد من وجود المجلد
ComfyUI/custom_nodes/Comfyui-Luck-gpt2.0/. - تأكد من تثبيت جميع الاعتماديات في ملف
requirements.txtبنجاح (ركز علىrequestsوPillow). - تحقق مما إذا كان هناك أي خطأ
ImportErrorباللون الأحمر عند تشغيل وحدة تحكم ComfyUI. - هل قمت بـ "إعادة تشغيل كاملة" لـ ComfyUI؟ (ملاحظة: الضغط على Ctrl+R لتحديث المتصفح لا يكفي).
س2: تظهر رسالة 401 Unauthorized أو Invalid API key؟
في 99% من الحالات، المشكلة تتعلق بالمفتاح أو base_url:
- يجب أن يتضمن مفتاح API البادئة
sk-بالكامل. - يجب أن ينتهي
base_urlبـ/v1(لا يمكنك كتابةhttps://api.apiyi.comفقط). - لا تقم بإضافة كلمة
Bearerيدوياً قبل المفتاح، فالعقدة تقوم بدمجها تلقائياً.
س3: تظهر رسالة 429 Too Many Requests؟
هذا يعني تجاوز حد الطلبات، إليك كيفية التعامل مع ذلك:
- على المدى القصير: ارفع قيمة
max_retriesإلى أكثر من 3، للسماح للعقدة بالانتظار وإعادة المحاولة تلقائياً. - على المدى الطويل: قم بتغيير
base_urlمنapi.apiyi.comإلىvip.apiyi.comأوb.apiyi.com؛ فهذه المسارات مخصصة للطلبات الكثيفة أو كمسارات احتياطية.
جدول رموز الخطأ الشائعة:
| رمز الخطأ | المعنى | الإجراء |
|---|---|---|
| 401 | مفتاح غير صالح | أعد النسخ وتأكد من وجود بادئة sk- |
| 403 | صلاحية غير كافية | تأكد من تفعيل النموذج في لوحة تحكم APIYI |
| 408 | انتهاء المهلة | ارفع قيمة timeout إلى 360 ثانية |
| 429 | تجاوز حد الطلبات | انتقل إلى مسار vip وزد عدد المحاولات (retries) |
| 500/502 | تقلبات في الخادم | سيتم إعادة المحاولة 3 مرات تلقائياً، أو انتقل لمسار b |
س4: هل تنتهي مهلة توليد صور 4K دائماً؟
- ارفع
timeoutإلى 480 ثانية (توليد 4K مع جودة عالية قد يستغرق 6 دقائق أحياناً). - يكفي ضبط
max_retries=2؛ لأن كثرة المحاولات ستراكم وقتاً طويلاً. - إذا كان اتصال الإنترنت ضعيفاً، يفضل استخدام
image_size=2Kثم استخدام عقدة Upscaler لاحقاً لتكبيرها إلى 4K، فهذا أسرع من الناحية العملية.
س5: القناع (Mask) لا يظهر بدقة في منطقة التعديل؟
- تأكد من أن القناع والصورة الأصلية لهما نفس العرض والارتفاع، دون إزاحة في البكسلات.
- تأكد من أن القناع أبيض وأسود خالص، ولا يحتوي على قناة شفافة.
- يجب أن تكون المناطق البيضاء (255,255,255) تماماً، لا تستخدم الرمادي الفاتح.
- يمكنك إضافة عقدة
ImageThresholdقبل عقدة القناع لفرض الثنائية (Binary).
س6: هل يمكن استخدامه بدون إنترنت تماماً؟
لا، لأن gpt-image-2 هو نموذج سحابي من OpenAI، ويجب الوصول إليه عبر بوابة. ولكن يمكنك تحقيق "توافر عالٍ زائف" من خلال مسارات APIYI الثلاثة؛ حيث يتم التبديل تلقائياً عند حدوث تقلبات في الموقع الرئيسي، مما يجعل التجربة قريبة جداً من النشر المحلي.
س7: النصوص في الموجه (Prompt) الصيني تظهر مشوهة؟
- العقدة المباشرة (Luck gpt-image-2) أقوى في تنسيق النصوص الإنجليزية.
- بالنسبة للموجهات الصينية، نوصي باستخدام العقدة العكسية (Luck gpt-2.0 all)، فهي تستخدم
gpt-image-2-allوتفهم الصينية بشكل أفضل. - إذا كنت مضطراً لاستخدام العقدة المباشرة مع الصينية، اكتب في الموجه مباشرة
render Chinese text "你好世界"بدلاً من ترك النموذج "يخمن" ما يجب كتابته.
س8: كيف يمكن تقدير التكاليف؟
- العقدة المباشرة (gpt-image-2): المحاسبة حسب الـ token، صورة 2K تكلف حوالي $0.08–0.15، وصورة 4K بجودة عالية تكلف حوالي $0.25–0.40.
- العقدة العكسية (gpt-image-2-all): المحاسبة حسب الصورة، حوالي $0.03 لكل صورة.
- ننصح بتفعيل "الحد اليومي للاستهلاك" في لوحة تحكم APIYI، وجرب 50-100 صورة كمعيار للقياس.
ثامناً: ملخص دمج gpt-image-2 في ComfyUI
إن دمج gpt-image-2 في ComfyUI يعني في جوهره امتلاك أقوى النماذج السحابية مع دقة العقد المحلية في لوحة رسم واحدة. بعد إتمام خطوات هذا المقال، يجب أن تكون قد:
- ✅ ثبتَّ إضافة Comfyui-Luck-gpt2.0 وحصلت على عقدتين جديدتين.
- ✅ حصلت على المفتاح من لوحة تحكم APIYI وأكملت إعدادات
base_urlوapi_key. - ✅ شغلت سير عمل تحويل النص إلى صورة بنجاح وتأكدت من اتصال المسار.
- ✅ أتقنت ضبط المعلمات لـ 1K/2K/4K، و15 نسبة عرض إلى ارتفاع، وأربع درجات للجودة، وثلاث صيغ للملفات (PNG/JPEG/WebP).
- ✅ نفذت بنجاح أحد سير العمل العملية: توليد 4K، إعادة الرسم بالقناع (Mask)، أو وضع التوفير الجماعي.
تكمن القيمة الكبرى لـ دمج gpt-image-2 في ComfyUI في تحويل "أفضل نموذج صور من OpenAI" إلى "عقدة عادية داخل لوحة ComfyUI". لم تعد بحاجة للتنقل بين المتصفح والأدوات المحلية، حيث يمكن ربط كل مراحل العمل في مسار واحد: gpt-image-2 لإنتاج العنصر الأساسي ← SDXL لإضافة الأسلوب ← Upscaler للتكبير ← SaveImage للحفظ.
🎯 نصيحة للخطوة التالية: ننصحك بطلب مفتاح تجريبي من منصة APIYI (يمكنك ضبط حد ميزانية منخفض)، وتشغيل أول صورة وفقاً لسير العمل المصغر في القسم 3.5، ثم التوسع تدريجياً إلى سير العمل العملي في القسم 5. إذا واجهت مشاكل في المعلمات، ارجع إلى جدول المراجعة السريعة في القسم 4؛ وإذا واجهت رموز خطأ، راجع قسم الأسئلة الشائعة في القسم 7. للحصول على ملفات JSON لسير عمل أكثر تعقيداً، يمكنك الرجوع إلى قسم نظام ComfyUI في وثائق APIYI الرسمية
docs.apiyi.com.
بهذا، أصبح لديك حل متكامل وقابل للاستخدام الإنتاجي لـ دمج gpt-image-2 في ComfyUI. نتمنى لك تجربة ممتعة في الرسم عبر ComfyUI.
الكاتب: فريق APIYI التقني
موارد ذات صلة:
- مستودع الإضافة: github.com/luckdvr/Comfyui-Luck-gpt2.0
- الموقع الرسمي لـ APIYI: apiyi.com
- وثائق APIYI: docs.apiyi.com
- موقع APIYI الرئيسي: api.apiyi.com (احتياطي: vip.apiyi.com / b.apiyi.com)
