用 OpenClaw 接入 Nano Banana Pro 圖片 API 的 5 步完整教程

讓 OpenClaw AI Agent 自動生成圖片是很多開發者想實現的功能。本文將介紹如何通過 5 個步驟爲 OpenClaw 創建自定義 Skill，接入 Nano Banana Pro 圖片生成 API，實現從聊天指令到自動出圖的完整工作流。

核心價值: 讀完本文，你將掌握 OpenClaw 自定義 Skill 的創建方法，學會通過 API易平臺接入 Nano Banana Pro 實現文生圖、圖片編輯和批量處理，讓你的 AI Agent 具備專業級圖片生成能力。

Nano Banana Pro 圖片 API 核心能力概覽

在開始接入之前，先了解 Nano Banana Pro 能爲你的 OpenClaw Agent 帶來什麼能力。

Nano Banana Pro（官方名稱 Gemini 3 Pro Image Preview）是 Google DeepMind 推出的專業級 AI 圖像生成模型，基於 Gemini 3 Pro 構建，被業界評爲「生成包含正確渲染和清晰可讀文本的圖像的最佳模型」。

Nano Banana Pro 核心技術參數

能力	參數	說明
文本渲染	錯誤率 < 10%	單行文本準確率業界領先
輸出分辨率	1K / 2K / 4K	原生高分辨率，無需後處理
參考圖像	最多 14 張	支持多圖合成和角色一致性
角色一致性	最多 5 個角色	跨場景角色面部一致
思考模式	Thinking Process	複雜構圖推理可視化
搜索接地	Google Search	基於實時數據生成可視化

🎯 接入建議: Nano Banana Pro 官方需要綁定 Google Cloud 海外信用卡，門檻較高。我們推薦通過 API易 apiyi.com 平臺接入，統一定價 $0.05/張（官方 4K 價格的 2 折），支持支付寶/微信支付，無需海外卡。

OpenClaw Skill 接入 Nano Banana Pro 的完整架構

理解整體架構有助於你更好地完成後續配置。

爲什麼選擇通過 API易接入

對比項	Google 官方直連	通過 API易 apiyi.com
4K 單價	$0.24/張	$0.05/張（2 折）
支付方式	海外信用卡	支付寶/微信支付/USDT
API 格式	Google 原生 SDK	Gemini 原生格式兼容
網絡要求	需科學上網	國內直連
併發限制	受 Quota 限制	不限併發，RPM 2000+
大客戶優惠	無	充值加贈最高 20%

第一步：創建 OpenClaw Skill 目錄結構

# 創建 Skill 目錄結構
mkdir -p ~/.openclaw/skills/nano-banana-pro/scripts
cd ~/.openclaw/skills/nano-banana-pro
touch SKILL.md scripts/generate.py scripts/edit.py

第二步：編寫 SKILL.md 定義文件

SKILL.md 是 OpenClaw 識別和調用你的 Skill 的核心文件，由 YAML 前置元數據和 Markdown 指令組成。

---
name: nano-banana-pro
description: Generate and edit images using Nano Banana Pro （Gemini 3 Pro Image） via API易 platform. Supports text-to-image， image editing， multi-image composition， and batch processing.
version: 1.0.0
metadata:
  openclaw:
    requires:
      env:
        - APIYI_API_KEY
      bins:
        - python3
    primaryEnv: APIYI_API_KEY
emoji: "🎨"
---

# Nano Banana Pro 圖片生成技能


## 功能
- **文生圖**: 根據文本描述生成高質量圖片（1K/2K/4K）
- **圖片編輯**: 對已有圖片進行修改、合成、風格轉換
- **批量處理**: 支持批量生成和批量編輯


## 使用方式

### 生成圖片
```bash
exec python3 scripts/generate.py --prompt "描述" --aspect-ratio "16:9" --resolution "2K"

編輯圖片

exec python3 scripts/edit.py --instruction "編輯指令" --image-url "圖片URL"

注意事項

使用 Gemini 原生 API 格式: /v1beta/models/{model}:generateContent
4K 圖片約需 60 秒，建議 exec timeout=120
建議使用英文提示詞獲得最佳效果


> 💡 **開發提示**: `primaryEnv: APIYI_API_KEY` 聲明後，OpenClaw 會自動將 API Key 注入到 Skill 運行環境中，你的腳本可以直接通過環境變量讀取，無需硬編碼密鑰。

---


## 第三步：編寫文生圖腳本 generate.py

這是核心腳本，負責接收 OpenClaw 傳入的參數，調用 Nano Banana Pro API 生成圖片。

### curl 快速測試（Gemini 原生格式）

先用一條 curl 命令驗證 API 是否通暢，這是最快的測試方式：

```bash
curl -s -X POST \
  "https://api.apiyi.com/v1beta/models/gemini-3-pro-image-preview:generateContent" \
  -H "Authorization: Bearer sk-你的API易密鑰" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "parts": [
        {"text": "Create a picture of a nano banana dish in a fancy restaurant with a Gemini theme"}
      ]
    }]，
    "generationConfig": {
      "responseModalities": ["IMAGE"]，
      "imageConfig": {
        "aspectRatio": "16:9"，
        "imageSize": "2K"
      }
    }
  }' | python3 -c "
import sys， json， base64
data = json.load（sys.stdin）
img_data = data['candidates'][0]['content']['parts'][0]['inlineData']['data']
sys.stdout.buffer.write（base64.b64decode（img_data））
" > gemini-native-image.png

執行成功後，當前目錄會生成 gemini-native-image.png 文件。

Python 腳本（Gemini 原生格式）

#！/usr/bin/env python3
"""Nano Banana Pro 文生圖腳本 - OpenClaw Skill（Gemini 原生格式）"""
import os， json， base64， argparse， requests
from datetime import datetime

API_KEY = os.environ.get（"APIYI_API_KEY"， ""）
API_BASE = "https://api.apiyi.com/v1beta/models"  # API易 Gemini 原生接口

def generate_image（prompt， aspect_ratio="16:9"， resolution="2K"）:
    url = f"{API_BASE}/gemini-3-pro-image-preview:generateContent"
    headers = {
        "Authorization": f"Bearer {API_KEY}"，
        "Content-Type": "application/json"
    }
    data = {
        "contents": [{"parts": [{"text": prompt}]}]，
        "generationConfig": {
            "responseModalities": ["IMAGE"]，
            "imageConfig": {
                "aspectRatio": aspect_ratio，
                "imageSize": resolution
            }
        }
    }
    response = requests.post（url， headers=headers， json=data， timeout=120）
    response.raise_for_status（）
    result = response.json（）

    # Gemini 原生格式：從 candidates 提取 inlineData
    parts = result["candidates"][0]["content"]["parts"]
    for part in parts:
        if "inlineData" in part:
            img_bytes = base64.b64decode（part["inlineData"]["data"]）
            filename = f"nano_banana_{datetime.now（）.strftime（'%Y%m%d_%H%M%S'）}.png"
            with open（filename， "wb"） as f:
                f.write（img_bytes）
            print（f"圖片已生成: {filename} （{len（img_bytes）/1024:.1f} KB）"）
            return filename
    print（"未能提取圖片數據"）
    return None

if __name__ == "__main__":
    parser = argparse.ArgumentParser（）
    parser.add_argument（"--prompt"， required=True）
    parser.add_argument（"--aspect-ratio"， default="16:9"）
    parser.add_argument（"--resolution"， default="2K"， help="分辨率: 1K/2K/4K"）
    args = parser.parse_args（）
    generate_image（args.prompt， args.aspect_ratio， args.resolution）

🚀 快速開始: 上面的代碼使用 API易 apiyi.com 的 Gemini 原生格式接口，端點爲 /v1beta/models/{model}:generateContent，響應結構與 Google 官方完全一致。在 API易控制檯: api.apiyi.com 創建 Key 即可開始使用。

第四步：編寫圖片編輯腳本 edit.py

Nano Banana Pro 不僅能生成圖片，還支持對已有圖片進行編輯。

#！/usr/bin/env python3
"""Nano Banana Pro 圖片編輯腳本 - OpenClaw Skill（Gemini 原生格式）"""
import os， json， base64， argparse， requests
from datetime import datetime

API_KEY = os.environ.get（"APIYI_API_KEY"， ""）
API_BASE = "https://api.apiyi.com/v1beta/models"

def edit_image（instruction， image_url， extra_images=None）:
    url = f"{API_BASE}/gemini-3-pro-image-preview:generateContent"
    headers = {"Authorization": f"Bearer {API_KEY}"， "Content-Type": "application/json"}

    # 構建 Gemini 原生格式的多模態 parts
    parts = [{"text": instruction}]
    # 將圖片 URL 轉爲 base64 內聯數據
    img_resp = requests.get（image_url， timeout=30）
    parts.append（{"inlineData": {"mimeType": "image/png"，
                                  "data": base64.b64encode（img_resp.content）.decode（）}}）
    if extra_images:  # 支持多圖合成（最多 14 張參考圖）
        for img_url in extra_images[:13]:
            r = requests.get（img_url， timeout=30）
            parts.append（{"inlineData": {"mimeType": "image/png"，
                                          "data": base64.b64encode（r.content）.decode（）}}）

    data = {
        "contents": [{"parts": parts}]，
        "generationConfig": {"responseModalities": ["IMAGE"]}
    }
    response = requests.post（url， headers=headers， json=data， timeout=120）
    response.raise_for_status（）
    result_parts = response.json（）["candidates"][0]["content"]["parts"]
    for part in result_parts:
        if "inlineData" in part:
            filename = f"edited_{datetime.now（）.strftime（'%Y%m%d_%H%M%S'）}.png"
            with open（filename， "wb"） as f:
                f.write（base64.b64decode（part["inlineData"]["data"]））
            print（f"編輯完成: {filename}"）
            return filename
    return None

if __name__ == "__main__":
    parser = argparse.ArgumentParser（）
    parser.add_argument（"--instruction"， required=True）
    parser.add_argument（"--image-url"， required=True）
    parser.add_argument（"--extra-images"， nargs="*"）
    args = parser.parse_args（）
    edit_image（args.instruction， args.image_url， args.extra_images）

圖片編輯能力總結

編輯類型	指令示例	處理時間
背景替換	"Remove background and add sunset"	~10 秒
風格轉換	"Convert to anime style"	~15 秒
元素添加	"Add sunglasses to the person"	~10 秒
多圖合成	"Combine these logos and add…"	~20 秒
文字添加	"Add title text: Hello World"	~10 秒
色彩調整	"Make the image warmer， increase contrast"	~8 秒

第五步：配置 OpenClaw 並測試

配置 API Key

在 OpenClaw 配置文件 ~/.openclaw/openclaw.json 中添加 Skill 配置：

{
  "skills": {
    "entries": {
      "nano-banana-pro": {
        "enabled": true，
        "apiKey": "sk-你的API易密鑰"
      }
    }
  }
}

測試 Skill

在消息平臺中發送測試指令驗證功能：

生成一張現代簡約風格的電商產品展示圖，白色背景，產品居中

驗證 Skill 是否正確加載：

openclaw skills list | grep nano-banana
openclaw skills test nano-banana-pro

💰 成本優化: Nano Banana Pro 通過 API易 apiyi.com 的統一定價爲 $0.05/張，不分分辨率。如果你的項目日均消耗超過 5000 張，可以享受充值加贈最高 20% 的優惠，單張成本低至 $0.04。

Nano Banana Pro API 成本與性能對比

選擇合適的接入方式對長期使用非常重要。

上方 SVG 圖表展示了詳細的定價對比和性能參數。關鍵數據：通過 API易接入 Nano Banana Pro，單張 4K 圖片成本僅 $0.05（官方 $0.24 的 2 折），大客戶充值加贈後低至 $0.04/張，平臺日均處理 10 萬+ 張圖片，不限併發。

常見問題

Q1: OpenClaw 接入 Nano Banana Pro 需要安裝哪些依賴？

只需要 Python 3 和 requests 庫。我們通過 API易 apiyi.com 的 Gemini 原生格式接口（/v1beta/models/{model}:generateContent）調用，不需要安裝 Google 的 google-generativeai SDK。運行 pip install requests 即可。你也可以直接用 curl 命令測試，無需任何依賴。

Q2: 生成 4K 圖片時 OpenClaw 報超時怎麼辦？

Nano Banana Pro 生成 4K 圖片約需 60 秒。在 SKILL.md 的使用說明中，建議 OpenClaw 使用 exec timeout=120 或 exec timeout=180 來調用腳本，避免默認超時導致任務中斷。

Q3: 可以用其他圖片生成模型替代 Nano Banana Pro 嗎？

可以。API易 apiyi.com 平臺同時支持多種圖片生成模型。你只需修改 generate.py 中的 model 參數即可切換，API 格式完全一致，無需修改其他代碼。

Q4: 如何確保 OpenClaw Skill 的安全性？

三個關鍵措施：第一，API Key 通過環境變量注入，不要硬編碼到腳本中；第二，只使用你自己創建的 Skill，避免從 ClawHub 安裝來源不明的圖片生成技能（已有 820+ 惡意技能被發現）；第三，定期檢查 OpenClaw 日誌確認沒有異常調用。

Q5: 圖片編輯支持哪些操作？效果如何？

Nano Banana Pro 支持背景替換、風格轉換、元素添加/刪除、多圖合成（最多 14 張參考圖）、文字渲染等。文字渲染是其最大優勢，單行文本錯誤率低於 10%，遠超 DALL-E 3 和 Midjourney。通過 API易平臺調用編輯功能，單次僅需 $0.05，平均 10 秒完成。

總結

通過本教程的 5 個步驟，你已經掌握了爲 OpenClaw 創建自定義 Skill 接入 Nano Banana Pro 圖片 API 的完整流程：

創建 Skill 目錄 — 標準的 SKILL.md + scripts/ 結構
編寫 SKILL.md — 聲明依賴、環境變量和使用指令
編寫文生圖腳本 — 通過 API易 Gemini 原生格式接口調用 Nano Banana Pro
編寫編輯腳本 — 支持多圖合成、背景替換、風格轉換
配置和測試 — 在 openclaw.json 中設置 Key，驗證功能

推薦通過 API易 apiyi.com 接入 Nano Banana Pro，享受統一 $0.05/張的定價（官方 4K 的 2 折），支持 Claude、GPT-4o、DeepSeek 等多模型統一接口，還可以在 imagen.apiyi.com 免費體驗出圖效果。

本文由 APIYI 技術團隊撰寫，關注 AI 大模型 API 接入實踐和 Agent 開發教程。更多技術指南請訪問 API易幫助中心: help.apiyi.com

用 OpenClaw 接入 Nano Banana Pro 圖片 API 的 5 步完整教程

Nano Banana Pro 圖片 API 核心能力概覽

Nano Banana Pro 核心技術參數

OpenClaw Skill 接入 Nano Banana Pro 的完整架構

爲什麼選擇通過 API易接入

第一步：創建 OpenClaw Skill 目錄結構

第二步：編寫 SKILL.md 定義文件

編輯圖片

注意事項

Python 腳本（Gemini 原生格式）

第四步：編寫圖片編輯腳本 edit.py

圖片編輯能力總結

第五步：配置 OpenClaw 並測試

配置 API Key

測試 Skill

Nano Banana Pro API 成本與性能對比

常見問題

總結

gpt-image-2 API 應用場景全解析：有哪 6 大業務領域？

Zed vs Cursor 跑 Claude Code 完整對比：5 個切換利好與決策指南

open-design 完整入門指南：3 步搭建開源 AI 設計生成系統（19 Skills 詳解）

gpt-image-2-vip 尺寸完全指南:30 檔分辨率組合 + $0.03 統一定價詳解

Seedream 4.5 vs Nano Banana Pro 深度對比:字節與谷歌 AI 圖像生成巔峯對決

選擇 API易 GPT-image-2 官轉 API 的 6 大核心優勢解析

Nano Banana Pro 圖片 API 核心能力概覽

Nano Banana Pro 核心技術參數

OpenClaw Skill 接入 Nano Banana Pro 的完整架構

爲什麼選擇通過 API易 接入

第一步：創建 OpenClaw Skill 目錄結構

第二步：編寫 SKILL.md 定義文件

編輯圖片

注意事項

Python 腳本（Gemini 原生格式）

第四步：編寫圖片編輯腳本 edit.py

圖片編輯能力總結

第五步：配置 OpenClaw 並測試

配置 API Key

測試 Skill

Nano Banana Pro API 成本與性能對比

常見問題

總結

Similar Posts

爲什麼選擇通過 API易接入