|

用 OpenClaw 接入 Nano Banana Pro 圖片 API 的 5 步完整教程

讓 OpenClaw AI Agent 自動生成圖片是很多開發者想實現的功能。本文將介紹 如何通過 5 個步驟爲 OpenClaw 創建自定義 Skill,接入 Nano Banana Pro 圖片生成 API,實現從聊天指令到自動出圖的完整工作流。

核心價值: 讀完本文,你將掌握 OpenClaw 自定義 Skill 的創建方法,學會通過 API易 平臺接入 Nano Banana Pro 實現文生圖、圖片編輯和批量處理,讓你的 AI Agent 具備專業級圖片生成能力。

openclaw-nano-banana-pro-image-api-tutorial-zh-hant 图示


Nano Banana Pro 圖片 API 核心能力概覽

在開始接入之前,先了解 Nano Banana Pro 能爲你的 OpenClaw Agent 帶來什麼能力。

Nano Banana Pro(官方名稱 Gemini 3 Pro Image Preview)是 Google DeepMind 推出的專業級 AI 圖像生成模型,基於 Gemini 3 Pro 構建,被業界評爲「生成包含正確渲染和清晰可讀文本的圖像的最佳模型」。

Nano Banana Pro 核心技術參數

能力 參數 說明
文本渲染 錯誤率 < 10% 單行文本準確率業界領先
輸出分辨率 1K / 2K / 4K 原生高分辨率,無需後處理
參考圖像 最多 14 張 支持多圖合成和角色一致性
角色一致性 最多 5 個角色 跨場景角色面部一致
思考模式 Thinking Process 複雜構圖推理可視化
搜索接地 Google Search 基於實時數據生成可視化

🎯 接入建議: Nano Banana Pro 官方需要綁定 Google Cloud 海外信用卡,門檻較高。我們推薦通過 API易 apiyi.com 平臺接入,統一定價 $0.05/張(官方 4K 價格的 2 折),支持支付寶/微信支付,無需海外卡。


OpenClaw Skill 接入 Nano Banana Pro 的完整架構

理解整體架構有助於你更好地完成後續配置。

openclaw-nano-banana-pro-image-api-tutorial-zh-hant 图示

爲什麼選擇通過 API易 接入

對比項 Google 官方直連 通過 API易 apiyi.com
4K 單價 $0.24/張 $0.05/張(2 折)
支付方式 海外信用卡 支付寶/微信支付/USDT
API 格式 Google 原生 SDK Gemini 原生格式兼容
網絡要求 需科學上網 國內直連
併發限制 受 Quota 限制 不限併發,RPM 2000+
大客戶優惠 充值加贈最高 20%

第一步:創建 OpenClaw Skill 目錄結構

# 創建 Skill 目錄結構
mkdir -p ~/.openclaw/skills/nano-banana-pro/scripts
cd ~/.openclaw/skills/nano-banana-pro
touch SKILL.md scripts/generate.py scripts/edit.py

第二步:編寫 SKILL.md 定義文件

SKILL.md 是 OpenClaw 識別和調用你的 Skill 的核心文件,由 YAML 前置元數據和 Markdown 指令組成。

---
name: nano-banana-pro
description: Generate and edit images using Nano Banana Pro (Gemini 3 Pro Image) via API易 platform. Supports text-to-image, image editing, multi-image composition, and batch processing.
version: 1.0.0
metadata:
  openclaw:
    requires:
      env:
        - APIYI_API_KEY
      bins:
        - python3
    primaryEnv: APIYI_API_KEY
emoji: "🎨"
---

# Nano Banana Pro 圖片生成技能


## 功能
- **文生圖**: 根據文本描述生成高質量圖片(1K/2K/4K)
- **圖片編輯**: 對已有圖片進行修改、合成、風格轉換
- **批量處理**: 支持批量生成和批量編輯


## 使用方式

### 生成圖片
```bash
exec python3 scripts/generate.py --prompt "描述" --aspect-ratio "16:9" --resolution "2K"

編輯圖片

exec python3 scripts/edit.py --instruction "編輯指令" --image-url "圖片URL"

注意事項

  • 使用 Gemini 原生 API 格式: /v1beta/models/{model}:generateContent
  • 4K 圖片約需 60 秒,建議 exec timeout=120
  • 建議使用英文提示詞獲得最佳效果

> 💡 **開發提示**: `primaryEnv: APIYI_API_KEY` 聲明後,OpenClaw 會自動將 API Key 注入到 Skill 運行環境中,你的腳本可以直接通過環境變量讀取,無需硬編碼密鑰。

---


## 第三步:編寫文生圖腳本 generate.py

這是核心腳本,負責接收 OpenClaw 傳入的參數,調用 Nano Banana Pro API 生成圖片。

### curl 快速測試(Gemini 原生格式)

先用一條 curl 命令驗證 API 是否通暢,這是最快的測試方式:

```bash
curl -s -X POST \
  "https://api.apiyi.com/v1beta/models/gemini-3-pro-image-preview:generateContent" \
  -H "Authorization: Bearer sk-你的API易密鑰" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "parts": [
        {"text": "Create a picture of a nano banana dish in a fancy restaurant with a Gemini theme"}
      ]
    }],
    "generationConfig": {
      "responseModalities": ["IMAGE"],
      "imageConfig": {
        "aspectRatio": "16:9",
        "imageSize": "2K"
      }
    }
  }' | python3 -c "
import sys, json, base64
data = json.load(sys.stdin)
img_data = data['candidates'][0]['content']['parts'][0]['inlineData']['data']
sys.stdout.buffer.write(base64.b64decode(img_data))
" > gemini-native-image.png

執行成功後,當前目錄會生成 gemini-native-image.png 文件。

Python 腳本(Gemini 原生格式)

#!/usr/bin/env python3
"""Nano Banana Pro 文生圖腳本 - OpenClaw Skill(Gemini 原生格式)"""
import os, json, base64, argparse, requests
from datetime import datetime

API_KEY = os.environ.get("APIYI_API_KEY", "")
API_BASE = "https://api.apiyi.com/v1beta/models"  # API易 Gemini 原生接口

def generate_image(prompt, aspect_ratio="16:9", resolution="2K"):
    url = f"{API_BASE}/gemini-3-pro-image-preview:generateContent"
    headers = {
        "Authorization": f"Bearer {API_KEY}",
        "Content-Type": "application/json"
    }
    data = {
        "contents": [{"parts": [{"text": prompt}]}],
        "generationConfig": {
            "responseModalities": ["IMAGE"],
            "imageConfig": {
                "aspectRatio": aspect_ratio,
                "imageSize": resolution
            }
        }
    }
    response = requests.post(url, headers=headers, json=data, timeout=120)
    response.raise_for_status()
    result = response.json()

    # Gemini 原生格式:從 candidates 提取 inlineData
    parts = result["candidates"][0]["content"]["parts"]
    for part in parts:
        if "inlineData" in part:
            img_bytes = base64.b64decode(part["inlineData"]["data"])
            filename = f"nano_banana_{datetime.now().strftime('%Y%m%d_%H%M%S')}.png"
            with open(filename, "wb") as f:
                f.write(img_bytes)
            print(f"圖片已生成: {filename} ({len(img_bytes)/1024:.1f} KB)")
            return filename
    print("未能提取圖片數據")
    return None

if __name__ == "__main__":
    parser = argparse.ArgumentParser()
    parser.add_argument("--prompt", required=True)
    parser.add_argument("--aspect-ratio", default="16:9")
    parser.add_argument("--resolution", default="2K", help="分辨率: 1K/2K/4K")
    args = parser.parse_args()
    generate_image(args.prompt, args.aspect_ratio, args.resolution)

🚀 快速開始: 上面的代碼使用 API易 apiyi.com 的 Gemini 原生格式接口,端點爲 /v1beta/models/{model}:generateContent,響應結構與 Google 官方完全一致。在 API易 控制檯: api.apiyi.com 創建 Key 即可開始使用。


第四步:編寫圖片編輯腳本 edit.py

Nano Banana Pro 不僅能生成圖片,還支持對已有圖片進行編輯。

#!/usr/bin/env python3
"""Nano Banana Pro 圖片編輯腳本 - OpenClaw Skill(Gemini 原生格式)"""
import os, json, base64, argparse, requests
from datetime import datetime

API_KEY = os.environ.get("APIYI_API_KEY", "")
API_BASE = "https://api.apiyi.com/v1beta/models"

def edit_image(instruction, image_url, extra_images=None):
    url = f"{API_BASE}/gemini-3-pro-image-preview:generateContent"
    headers = {"Authorization": f"Bearer {API_KEY}", "Content-Type": "application/json"}

    # 構建 Gemini 原生格式的多模態 parts
    parts = [{"text": instruction}]
    # 將圖片 URL 轉爲 base64 內聯數據
    img_resp = requests.get(image_url, timeout=30)
    parts.append({"inlineData": {"mimeType": "image/png",
                                  "data": base64.b64encode(img_resp.content).decode()}})
    if extra_images:  # 支持多圖合成(最多 14 張參考圖)
        for img_url in extra_images[:13]:
            r = requests.get(img_url, timeout=30)
            parts.append({"inlineData": {"mimeType": "image/png",
                                          "data": base64.b64encode(r.content).decode()}})

    data = {
        "contents": [{"parts": parts}],
        "generationConfig": {"responseModalities": ["IMAGE"]}
    }
    response = requests.post(url, headers=headers, json=data, timeout=120)
    response.raise_for_status()
    result_parts = response.json()["candidates"][0]["content"]["parts"]
    for part in result_parts:
        if "inlineData" in part:
            filename = f"edited_{datetime.now().strftime('%Y%m%d_%H%M%S')}.png"
            with open(filename, "wb") as f:
                f.write(base64.b64decode(part["inlineData"]["data"]))
            print(f"編輯完成: {filename}")
            return filename
    return None

if __name__ == "__main__":
    parser = argparse.ArgumentParser()
    parser.add_argument("--instruction", required=True)
    parser.add_argument("--image-url", required=True)
    parser.add_argument("--extra-images", nargs="*")
    args = parser.parse_args()
    edit_image(args.instruction, args.image_url, args.extra_images)

圖片編輯能力總結

編輯類型 指令示例 處理時間
背景替換 "Remove background and add sunset" ~10 秒
風格轉換 "Convert to anime style" ~15 秒
元素添加 "Add sunglasses to the person" ~10 秒
多圖合成 "Combine these logos and add…" ~20 秒
文字添加 "Add title text: Hello World" ~10 秒
色彩調整 "Make the image warmer, increase contrast" ~8 秒

第五步:配置 OpenClaw 並測試

配置 API Key

在 OpenClaw 配置文件 ~/.openclaw/openclaw.json 中添加 Skill 配置:

{
  "skills": {
    "entries": {
      "nano-banana-pro": {
        "enabled": true,
        "apiKey": "sk-你的API易密鑰"
      }
    }
  }
}

openclaw-nano-banana-pro-image-api-tutorial-zh-hant 图示

測試 Skill

在消息平臺中發送測試指令驗證功能:

生成一張現代簡約風格的電商產品展示圖,白色背景,產品居中

驗證 Skill 是否正確加載:

openclaw skills list | grep nano-banana
openclaw skills test nano-banana-pro

💰 成本優化: Nano Banana Pro 通過 API易 apiyi.com 的統一定價爲 $0.05/張,不分分辨率。如果你的項目日均消耗超過 5000 張,可以享受充值加贈最高 20% 的優惠,單張成本低至 $0.04。


Nano Banana Pro API 成本與性能對比

選擇合適的接入方式對長期使用非常重要。

openclaw-nano-banana-pro-image-api-tutorial-zh-hant 图示

上方 SVG 圖表展示了詳細的定價對比和性能參數。關鍵數據:通過 API易 接入 Nano Banana Pro,單張 4K 圖片成本僅 $0.05(官方 $0.24 的 2 折),大客戶充值加贈後低至 $0.04/張,平臺日均處理 10 萬+ 張圖片,不限併發。


常見問題

Q1: OpenClaw 接入 Nano Banana Pro 需要安裝哪些依賴?

只需要 Python 3 和 requests 庫。我們通過 API易 apiyi.com 的 Gemini 原生格式接口(/v1beta/models/{model}:generateContent)調用,不需要安裝 Google 的 google-generativeai SDK。運行 pip install requests 即可。你也可以直接用 curl 命令測試,無需任何依賴。

Q2: 生成 4K 圖片時 OpenClaw 報超時怎麼辦?

Nano Banana Pro 生成 4K 圖片約需 60 秒。在 SKILL.md 的使用說明中,建議 OpenClaw 使用 exec timeout=120exec timeout=180 來調用腳本,避免默認超時導致任務中斷。

Q3: 可以用其他圖片生成模型替代 Nano Banana Pro 嗎?

可以。API易 apiyi.com 平臺同時支持多種圖片生成模型。你只需修改 generate.py 中的 model 參數即可切換,API 格式完全一致,無需修改其他代碼。

Q4: 如何確保 OpenClaw Skill 的安全性?

三個關鍵措施:第一,API Key 通過環境變量注入,不要硬編碼到腳本中;第二,只使用你自己創建的 Skill,避免從 ClawHub 安裝來源不明的圖片生成技能(已有 820+ 惡意技能被發現);第三,定期檢查 OpenClaw 日誌確認沒有異常調用。

Q5: 圖片編輯支持哪些操作?效果如何?

Nano Banana Pro 支持背景替換、風格轉換、元素添加/刪除、多圖合成(最多 14 張參考圖)、文字渲染等。文字渲染是其最大優勢,單行文本錯誤率低於 10%,遠超 DALL-E 3 和 Midjourney。通過 API易 平臺調用編輯功能,單次僅需 $0.05,平均 10 秒完成。


總結

通過本教程的 5 個步驟,你已經掌握了爲 OpenClaw 創建自定義 Skill 接入 Nano Banana Pro 圖片 API 的完整流程:

  1. 創建 Skill 目錄 — 標準的 SKILL.md + scripts/ 結構
  2. 編寫 SKILL.md — 聲明依賴、環境變量和使用指令
  3. 編寫文生圖腳本 — 通過 API易 Gemini 原生格式接口調用 Nano Banana Pro
  4. 編寫編輯腳本 — 支持多圖合成、背景替換、風格轉換
  5. 配置和測試 — 在 openclaw.json 中設置 Key,驗證功能

推薦通過 API易 apiyi.com 接入 Nano Banana Pro,享受統一 $0.05/張的定價(官方 4K 的 2 折),支持 Claude、GPT-4o、DeepSeek 等多模型統一接口,還可以在 imagen.apiyi.com 免費體驗出圖效果。


本文由 APIYI 技術團隊撰寫,關注 AI 大模型 API 接入實踐和 Agent 開發教程。更多技術指南請訪問 API易幫助中心: help.apiyi.com

Similar Posts