|

دليل تعليمي كامل من 5 خطوات لربط واجهة برمجة تطبيقات الصور Nano Banana Pro باستخدام OpenClaw

يعد جعل وكيل الذكاء الاصطناعي OpenClaw (AI Agent) يقوم بتوليد الصور تلقائيًا ميزة يسعى الكثير من المطورين لتحقيقها. سنستعرض في هذا المقال كيفية إنشاء مهارة (Skill) مخصصة لـ OpenClaw في 5 خطوات، وربطها بـ واجهة برمجة تطبيقات (API) توليد الصور Nano Banana Pro عبر منصة APIYI، لتحقيق سير عمل كامل يبدأ من أوامر الدردشة وينتهي بتوليد الصور تلقائيًا.

القيمة الجوهرية: بنهاية هذا المقال، ستتقن طريقة إنشاء المهارات المخصصة في OpenClaw، وتتعلم كيفية استخدام منصة APIYI للوصول إلى Nano Banana Pro لتنفيذ عمليات تحويل النص إلى صورة، وتحرير الصور، والمعالجة الجماعية، مما يمنح وكيل الذكاء الاصطناعي الخاص بك قدرات احترافية في توليد الصور.

openclaw-nano-banana-pro-image-api-tutorial-ar 图示


نظرة عامة على القدرات الأساسية لـ Nano Banana Pro Image API

قبل البدء في عملية الربط، دعنا نتعرف على القدرات التي يمكن لـ Nano Banana Pro أن يضيفها إلى وكيل OpenClaw الخاص بك.

يعد Nano Banana Pro (الاسم الرسمي Gemini 3 Pro Image Preview) نموذجاً احترافياً لتوليد الصور بالذكاء الاصطناعي أطلقته Google DeepMind. يعتمد النموذج على Gemini 3 Pro، ويُصنف في الأوساط التقنية كـ "أفضل نموذج لتوليد صور تحتوي على نصوص واضحة وقابلة للقراءة ومعالجة بدقة".

المعلمات التقنية الأساسية لـ Nano Banana Pro

القدرة المعلمة الوصف
معالجة النصوص معدل الخطأ < 10% دقة رائدة في الصناعة للنصوص ذات السطر الواحد
دقة الإخراج 1K / 2K / 4K دقة عالية أصلية، لا حاجة لمعالجة لاحقة
الصور المرجعية حتى 14 صورة يدعم دمج الصور المتعددة واتساق الشخصيات
اتساق الشخصيات حتى 5 شخصيات اتساق وجوه الشخصيات عبر المشاهد المختلفة
وضع التفكير عملية التفكير (Thinking Process) تصور استنتاجي للتكوينات المعقدة
الربط بالبحث بحث Google توليد مرئيات بناءً على بيانات فورية

🎯 نصيحة للربط: يتطلب Nano Banana Pro الرسمي ربط بطاقة ائتمان دولية من Google Cloud، وهو أمر قد يكون صعباً. نوصي بالربط عبر منصة APIYI (apiyi.com)، حيث يبلغ السعر الموحد 0.05 دولار للصورة (خصم 80% عن سعر الـ 4K الرسمي)، ويدعم الدفع عبر Alipay/WeChat دون الحاجة لبطاقة دولية.


الهيكل الكامل لربط OpenClaw Skill بـ Nano Banana Pro

سيساعدك فهم الهيكل العام على إكمال الإعدادات اللاحقة بشكل أفضل.

openclaw-nano-banana-pro-image-api-tutorial-ar 图示

لماذا تختار الربط عبر APIYI

وجه المقارنة اتصال مباشر عبر Google الرسمي عبر APIYI (apiyi.com)
سعر الـ 4K للصورة 0.24 دولار / صورة 0.05 دولار / صورة (خصم 80%)
طريقة الدفع بطاقة ائتمان دولية Alipay / WeChat Pay / USDT
تنسيق API SDK الأصلي من Google متوافق مع تنسيق Gemini الأصلي
متطلبات الشبكة يتطلب أدوات لتخطي الحجب اتصال مباشر محلي
قيود التزامن يخضع لقيود الحصص (Quota) تزامن غير محدود، RPM 2000+
خصومات كبار العملاء لا يوجد رصيد إضافي عند الشحن يصل إلى 20%

الخطوة الأولى: إنشاء هيكل دليل OpenClaw Skill

# إنشاء هيكل دليل الـ Skill
mkdir -p ~/.openclaw/skills/nano-banana-pro/scripts
cd ~/.openclaw/skills/nano-banana-pro
touch SKILL.md scripts/generate.py scripts/edit.py

الخطوة الثانية: كتابة ملف تعريف SKILL.md

يُعد ملف SKILL.md هو الملف الأساسي الذي يتعرف من خلاله OpenClaw على الـ Skill الخاصة بك ويقوم باستدعائها، ويتكون من بيانات YAML التعريفية (Front Matter) وتعليمات Markdown.

---
name: nano-banana-pro
description: Generate and edit images using Nano Banana Pro (Gemini 3 Pro Image) via APIYI platform. Supports text-to-image, image editing, multi-image composition, and batch processing.
version: 1.0.0
metadata:
  openclaw:
    requires:
      env:
        - APIYI_API_KEY
      bins:
        - python3
    primaryEnv: APIYI_API_KEY
emoji: "🎨"
---

# مهارة توليد الصور Nano Banana Pro

الميزات

  • تحويل النص إلى صورة: توليد صور عالية الجودة (1K/2K/4K) بناءً على الأوصاف النصية.
  • تحرير الصور: تعديل الصور الموجودة، ودمجها، وتحويل أنماطها.
  • المعالجة الدفعية: دعم التوليد والتحرير بالدفعات.

كيفية الاستخدام

توليد الصور

exec python3 scripts/generate.py --prompt "الوصف" --aspect-ratio "16:9" --resolution "2K"

تحرير الصور

exec python3 scripts/edit.py --instruction "تعليمات التحرير" --image-url "رابط الصورة"

ملاحظات هامة

  • استخدم تنسيق Gemini API الأصلي: /v1beta/models/{model}:generateContent
  • تستغرق صور 4K حوالي 60 ثانية، لذا يُنصح بضبط مهلة التنفيذ exec timeout=120.
  • يُنصح باستخدام موجهات (prompts) باللغة الإنجليزية للحصول على أفضل النتائج.

💡 نصيحة للمطورين: بعد التصريح عن primaryEnv: APIYI_API_KEY ، سيقوم OpenClaw تلقائيًا بحقن مفتاح API في بيئة تشغيل الـ Skill، ويمكن لسكربتك قراءته مباشرة عبر متغيرات البيئة دون الحاجة لكتابة المفتاح بشكل صريح داخل الكود.


الخطوة الثالثة: كتابة نص برمجى (Script) لتحويل النص إلى صورة generate.py

هذا هو النص البرمجي الأساسي، وهو مسؤول عن استقبال المعاملات (parameters) المرسلة من OpenClaw، واستدعاء واجهة برمجة تطبيقات (API) Nano Banana Pro لتوليد الصور.

اختبار سريع باستخدام curl (بتنسيق Gemini الأصلي)

لنبدأ باستخدام أمر curl للتحقق من اتصال واجهة برمجة التطبيقات، فهذه هي أسرع طريقة للاختبار:

curl -s -X POST \
  "https://api.apiyi.com/v1beta/models/gemini-3-pro-image-preview:generateContent" \
  -H "Authorization: Bearer sk-مفتاح_APIYI_الخاص_بك" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "parts": [
        {"text": "Create a picture of a nano banana dish in a fancy restaurant with a Gemini theme"}
      ]
    }],
    "generationConfig": {
      "responseModalities": ["IMAGE"],
      "imageConfig": {
        "aspectRatio": "16:9",
        "imageSize": "2K"
      }
    }
  }' | python3 -c "
import sys, json, base64
data = json.load(sys.stdin)
img_data = data['candidates'][0]['content']['parts'][0]['inlineData']['data']
sys.stdout.buffer.write(base64.b64decode(img_data))
" > gemini-native-image.png

بعد التنفيذ بنجاح، سيتم إنشاء ملف باسم gemini-native-image.png في المجلد الحالي.

نص برمجى Python (بتنسيق Gemini الأصلي)

#!/usr/bin/env python3
"""نص برمجى لتحويل النص إلى صورة لـ Nano Banana Pro - مهارة OpenClaw (بتنسيق Gemini الأصلي)"""
import os, json, base64, argparse, requests
from datetime import datetime

API_KEY = os.environ.get("APIYI_API_KEY", "")
API_BASE = "https://api.apiyi.com/v1beta/models"  # واجهة Gemini الأصلية من APIYI

def generate_image(prompt, aspect_ratio="16:9", resolution="2K"):
    url = f"{API_BASE}/gemini-3-pro-image-preview:generateContent"
    headers = {
        "Authorization": f"Bearer {API_KEY}",
        "Content-Type": "application/json"
    }
    data = {
        "contents": [{"parts": [{"text": prompt}]}],
        "generationConfig": {
            "responseModalities": ["IMAGE"],
            "imageConfig": {
                "aspectRatio": aspect_ratio,
                "imageSize": resolution
            }
        }
    }
    response = requests.post(url, headers=headers, json=data, timeout=120)
    response.raise_for_status()
    result = response.json()

    # تنسيق Gemini الأصلي: استخراج inlineData من candidates
    parts = result["candidates"][0]["content"]["parts"]
    for part in parts:
        if "inlineData" in part:
            img_bytes = base64.b64decode(part["inlineData"]["data"])
            filename = f"nano_banana_{datetime.now().strftime('%Y%m%d_%H%M%S')}.png"
            with open(filename, "wb") as f:
                f.write(img_bytes)
            print(f"تم توليد الصورة: {filename} ({len(img_bytes)/1024:.1f} KB)")
            return filename
    print("فشل استخراج بيانات الصورة")
    return None

if __name__ == "__main__":
    parser = argparse.ArgumentParser()
    parser.add_argument("--prompt", required=True)
    parser.add_argument("--aspect-ratio", default="16:9")
    parser.add_argument("--resolution", default="2K", help="الدقة: 1K/2K/4K")
    args = parser.parse_args()
    generate_image(args.prompt, args.aspect_ratio, args.resolution)

🚀 بداية سريعة: يستخدم الكود أعلاه واجهة تنسيق Gemini الأصلي من APIYI (apiyi.com)، ونقطة النهاية (endpoint) هي /v1beta/models/{model}:generateContent؛ حيث يتطابق هيكل الاستجابة تماماً مع Google الرسمي. ما عليك سوى إنشاء مفتاح (Key) في لوحة تحكم APIYI: api.apiyi.com للبدء في الاستخدام.


الخطوة الرابعة: كتابة نص برمجى لتحرير الصور edit.py

لا يقتصر دور Nano Banana Pro على توليد الصور فحسب، بل يدعم أيضاً تحرير الصور الموجودة.

#!/usr/bin/env python3
"""نص برمجى لتحرير الصور لـ Nano Banana Pro - مهارة OpenClaw (بتنسيق Gemini الأصلي)"""
import os, json, base64, argparse, requests
from datetime import datetime

API_KEY = os.environ.get("APIYI_API_KEY", "")
API_BASE = "https://api.apiyi.com/v1beta/models"

def edit_image(instruction, image_url, extra_images=None):
    url = f"{API_BASE}/gemini-3-pro-image-preview:generateContent"
    headers = {"Authorization": f"Bearer {API_KEY}", "Content-Type": "application/json"}

    # بناء أجزاء (parts) متعددة الوسائط بتنسيق Gemini الأصلي
    parts = [{"text": instruction}]
    # تحويل رابط الصورة إلى بيانات base64 مضمنة (inline)
    img_resp = requests.get(image_url, timeout=30)
    parts.append({"inlineData": {"mimeType": "image/png",
                                  "data": base64.b64encode(img_resp.content).decode()}})
    if extra_images:  # دعم دمج صور متعددة (حتى 14 صورة مرجعية)
        for img_url in extra_images[:13]:
            r = requests.get(img_url, timeout=30)
            parts.append({"inlineData": {"mimeType": "image/png",
                                          "data": base64.b64encode(r.content).decode()}})

    data = {
        "contents": [{"parts": parts}],
        "generationConfig": {"responseModalities": ["IMAGE"]}
    }
    response = requests.post(url, headers=headers, json=data, timeout=120)
    response.raise_for_status()
    result_parts = response.json()["candidates"][0]["content"]["parts"]
    for part in result_parts:
        if "inlineData" in part:
            filename = f"edited_{datetime.now().strftime('%Y%m%d_%H%M%S')}.png"
            with open(filename, "wb") as f:
                f.write(base64.b64decode(part["inlineData"]["data"]))
            print(f"اكتمل التحرير: {filename}")
            return filename
    return None

if __name__ == "__main__":
    parser = argparse.ArgumentParser()
    parser.add_argument("--instruction", required=True)
    parser.add_argument("--image-url", required=True)
    parser.add_argument("--extra-images", nargs="*")
    args = parser.parse_args()
    edit_image(args.instruction, args.image_url, args.extra_images)

ملخص قدرات تحرير الصور

نوع التحرير مثال على الموجه وقت المعالجة
استبدال الخلفية "Remove background and add sunset" ~10 ثوانٍ
تحويل النمط "Convert to anime style" ~15 ثانية
إضافة عناصر "Add sunglasses to the person" ~10 ثوانٍ
دمج صور متعددة "Combine these logos and add…" ~20 ثانية
إضافة نص "Add title text: Hello World" ~10 ثوانٍ
تعديل الألوان "Make the image warmer, increase contrast" ~8 ثوانٍ

الخطوة الخامسة: إعداد OpenClaw واختباره

إعداد مفتاح API

أضف إعدادات الـ Skill في ملف تكوين OpenClaw الموجود في ~/.openclaw/openclaw.json:

{
  "skills": {
    "entries": {
      "nano-banana-pro": {
        "enabled": true,
        "apiKey": "sk-مفتاح-APIYI-الخاص-بك"
      }
    }
  }
}

openclaw-nano-banana-pro-image-api-tutorial-ar 图示

اختبار الـ Skill

أرسل أمر اختبار في منصة المراسلة للتحقق من الوظيفة:

قم بتوليد صورة عرض لمنتج تجارة إلكترونية بأسلوب عصري وبسيط، خلفية بيضاء، والمنتج في المنتصف.

تحقق مما إذا كان الـ Skill قد تم تحميله بشكل صحيح:

openclaw skills list | grep nano-banana
openclaw skills test nano-banana-pro

💰 تحسين التكلفة: يتم تسعير Nano Banana Pro عبر APIYI (apiyi.com) بسعر موحد قدره 0.05 دولار للصورة الواحدة، بغض النظر عن الدقة. إذا كان مشروعك يستهلك أكثر من 5000 صورة يومياً في المتوسط، يمكنك الاستفادة من مكافأة شحن تصل إلى 20%، مما يخفض تكلفة الصورة الواحدة إلى 0.04 دولار.


مقارنة التكلفة والأداء لـ Nano Banana Pro API

يعد اختيار طريقة الوصول المناسبة أمراً بالغ الأهمية للاستخدام على المدى الطويل.

openclaw-nano-banana-pro-image-api-tutorial-ar 图示

يوضح الرسم البياني أعلاه مقارنة مفصلة للأسعار ومعايير الأداء. البيانات الرئيسية: من خلال الوصول إلى Nano Banana Pro عبر APIYI، تبلغ تكلفة الصورة الواحدة بدقة 4K حوالي 0.05 دولار فقط (أي 20% من السعر الرسمي البالغ 0.24 دولار). وبالنسبة لكبار العملاء، تنخفض التكلفة إلى 0.04 دولار للصورة بعد مكافآت الشحن. تعالج المنصة أكثر من 100,000 صورة يومياً مع عدد غير محدود من الطلبات المتزامنة.


الأسئلة الشائعة

س1: ما هي التبعيات (Dependencies) التي يجب تثبيتها لربط OpenClaw بـ Nano Banana Pro؟

تحتاج فقط إلى Python 3 ومكتبة requests. نحن نقوم باستدعاء النموذج عبر واجهة تنسيق Gemini الأصلية (/v1beta/models/{model}:generateContent) الخاصة بـ APIYI apiyi.com، لذا لا داعي لتثبيت SDK الخاص بـ Google (google-generativeai). يكفي تشغيل الأمر pip install requests. يمكنك أيضاً الاختبار باستخدام أمر curl مباشرة دون الحاجة لأي تبعيات.

س2: ماذا أفعل إذا ظهر خطأ انتهاء المهلة (Timeout) في OpenClaw عند توليد صور بدقة 4K؟

يستغرق توليد صور بدقة 4K في Nano Banana Pro حوالي 60 ثانية. في تعليمات الاستخدام بملف SKILL.md، نوصي باستخدام exec timeout=120 أو exec timeout=180 عند استدعاء السكربت في OpenClaw لتجنب انقطاع المهمة بسبب المهلة الافتراضية.

س3: هل يمكن استخدام نماذج توليد صور أخرى بدلاً من Nano Banana Pro؟

نعم، تدعم منصة APIYI apiyi.com نماذج متعددة لتوليد الصور في وقت واحد. كل ما عليك فعله هو تعديل معامل model في ملف generate.py للتبديل بينها، حيث أن تنسيق API متطابق تماماً ولا يتطلب تعديل أي كود آخر.

س4: كيف يمكن ضمان أمان مهارة (Skill) OpenClaw؟

هناك ثلاثة إجراءات رئيسية: أولاً، يتم حقن مفتاح API عبر متغيرات البيئة، ولا تقم بكتابته مباشرة في السكربت؛ ثانياً، استخدم فقط المهارات التي أنشأتها بنفسك، وتجنب تثبيت مهارات توليد الصور مجهولة المصدر من ClawHub (تم اكتشاف أكثر من 820 مهارة ضارة بالفعل)؛ ثالثاً، تحقق بانتظام من سجلات OpenClaw للتأكد من عدم وجود استدعاءات غير طبيعية.

س5: ما هي عمليات تحرير الصور المدعومة؟ وكيف هي النتائج؟

يدعم Nano Banana Pro استبدال الخلفية، تحويل النمط، إضافة/حذف العناصر، دمج صور متعددة (حتى 14 صورة مرجعية)، ورسم النصوص وغيرها. رسم النصوص هو أكبر ميزة له، حيث يقل معدل الخطأ في النصوص المكونة من سطر واحد عن 10%، وهو ما يتفوق بمراحل على DALL-E 3 وMidjourney. عبر منصة APIYI، تكلف عملية التحرير الواحدة 0.05 دولار فقط وتكتمل في غضون 10 ثوانٍ في المتوسط.


الخلاصة

من خلال الخطوات الخمس في هذا الدليل، تكون قد أتقنت العملية الكاملة لإنشاء مهارة مخصصة لـ OpenClaw للوصول إلى واجهة برمجة تطبيقات الصور Nano Banana Pro:

  1. إنشاء دليل المهارة — هيكل قياسي يتكون من SKILL.md + مجلد scripts/.
  2. كتابة SKILL.md — التصريح عن التبعيات، متغيرات البيئة، وتعليمات الاستخدام.
  3. كتابة سكربت تحويل النص إلى صورة — استدعاء Nano Banana Pro عبر واجهة تنسيق Gemini الأصلية في APIYI.
  4. كتابة سكربت التحرير — يدعم دمج الصور المتعددة، استبدال الخلفية، وتحويل النمط.
  5. التكوين والاختبار — إعداد المفتاح في openclaw.json والتحقق من الوظائف.

نوصي بالوصول إلى Nano Banana Pro عبر APIYI apiyi.com للاستمتاع بسعر موحد قدره 0.05 دولار للصورة (ما يعادل 20% فقط من السعر الرسمي لصور 4K)، مع دعم واجهة موحدة لنماذج Claude وGPT-4o وDeepSeek وغيرها، كما يمكنك تجربة جودة الصور مجاناً عبر imagen.apiyi.com.


تمت كتابة هذا المقال بواسطة الفريق التقني لـ APIYI، نحن نركز على ممارسات ربط واجهات برمجة تطبيقات نماذج اللغة الكبيرة وتطوير الوكلاء (Agents). لمزيد من الأدلة التقنية، يرجى زيارة مركز مساعدة APIYI: help.apiyi.com

موضوعات ذات صلة