讓 OpenClaw AI Agent 自動生成圖片是很多開發者想實現的功能。本文將介紹 如何通過 5 個步驟爲 OpenClaw 創建自定義 Skill,接入 Nano Banana Pro 圖片生成 API,實現從聊天指令到自動出圖的完整工作流。
核心價值: 讀完本文,你將掌握 OpenClaw 自定義 Skill 的創建方法,學會通過 API易 平臺接入 Nano Banana Pro 實現文生圖、圖片編輯和批量處理,讓你的 AI Agent 具備專業級圖片生成能力。

Nano Banana Pro 圖片 API 核心能力概覽
在開始接入之前,先了解 Nano Banana Pro 能爲你的 OpenClaw Agent 帶來什麼能力。
Nano Banana Pro(官方名稱 Gemini 3 Pro Image Preview)是 Google DeepMind 推出的專業級 AI 圖像生成模型,基於 Gemini 3 Pro 構建,被業界評爲「生成包含正確渲染和清晰可讀文本的圖像的最佳模型」。
Nano Banana Pro 核心技術參數
| 能力 | 參數 | 說明 |
|---|---|---|
| 文本渲染 | 錯誤率 < 10% | 單行文本準確率業界領先 |
| 輸出分辨率 | 1K / 2K / 4K | 原生高分辨率,無需後處理 |
| 參考圖像 | 最多 14 張 | 支持多圖合成和角色一致性 |
| 角色一致性 | 最多 5 個角色 | 跨場景角色面部一致 |
| 思考模式 | Thinking Process | 複雜構圖推理可視化 |
| 搜索接地 | Google Search | 基於實時數據生成可視化 |
🎯 接入建議: Nano Banana Pro 官方需要綁定 Google Cloud 海外信用卡,門檻較高。我們推薦通過 API易 apiyi.com 平臺接入,統一定價 $0.05/張(官方 4K 價格的 2 折),支持支付寶/微信支付,無需海外卡。
OpenClaw Skill 接入 Nano Banana Pro 的完整架構
理解整體架構有助於你更好地完成後續配置。

爲什麼選擇通過 API易 接入
| 對比項 | Google 官方直連 | 通過 API易 apiyi.com |
|---|---|---|
| 4K 單價 | $0.24/張 | $0.05/張(2 折) |
| 支付方式 | 海外信用卡 | 支付寶/微信支付/USDT |
| API 格式 | Google 原生 SDK | Gemini 原生格式兼容 |
| 網絡要求 | 需科學上網 | 國內直連 |
| 併發限制 | 受 Quota 限制 | 不限併發,RPM 2000+ |
| 大客戶優惠 | 無 | 充值加贈最高 20% |
第一步:創建 OpenClaw Skill 目錄結構
# 創建 Skill 目錄結構
mkdir -p ~/.openclaw/skills/nano-banana-pro/scripts
cd ~/.openclaw/skills/nano-banana-pro
touch SKILL.md scripts/generate.py scripts/edit.py
第二步:編寫 SKILL.md 定義文件
SKILL.md 是 OpenClaw 識別和調用你的 Skill 的核心文件,由 YAML 前置元數據和 Markdown 指令組成。
---
name: nano-banana-pro
description: Generate and edit images using Nano Banana Pro (Gemini 3 Pro Image) via API易 platform. Supports text-to-image, image editing, multi-image composition, and batch processing.
version: 1.0.0
metadata:
openclaw:
requires:
env:
- APIYI_API_KEY
bins:
- python3
primaryEnv: APIYI_API_KEY
emoji: "🎨"
---
# Nano Banana Pro 圖片生成技能
## 功能
- **文生圖**: 根據文本描述生成高質量圖片(1K/2K/4K)
- **圖片編輯**: 對已有圖片進行修改、合成、風格轉換
- **批量處理**: 支持批量生成和批量編輯
## 使用方式
### 生成圖片
```bash
exec python3 scripts/generate.py --prompt "描述" --aspect-ratio "16:9" --resolution "2K"
編輯圖片
exec python3 scripts/edit.py --instruction "編輯指令" --image-url "圖片URL"
注意事項
- 使用 Gemini 原生 API 格式:
/v1beta/models/{model}:generateContent - 4K 圖片約需 60 秒,建議 exec timeout=120
- 建議使用英文提示詞獲得最佳效果
> 💡 **開發提示**: `primaryEnv: APIYI_API_KEY` 聲明後,OpenClaw 會自動將 API Key 注入到 Skill 運行環境中,你的腳本可以直接通過環境變量讀取,無需硬編碼密鑰。
---
## 第三步:編寫文生圖腳本 generate.py
這是核心腳本,負責接收 OpenClaw 傳入的參數,調用 Nano Banana Pro API 生成圖片。
### curl 快速測試(Gemini 原生格式)
先用一條 curl 命令驗證 API 是否通暢,這是最快的測試方式:
```bash
curl -s -X POST \
"https://api.apiyi.com/v1beta/models/gemini-3-pro-image-preview:generateContent" \
-H "Authorization: Bearer sk-你的API易密鑰" \
-H "Content-Type: application/json" \
-d '{
"contents": [{
"parts": [
{"text": "Create a picture of a nano banana dish in a fancy restaurant with a Gemini theme"}
]
}],
"generationConfig": {
"responseModalities": ["IMAGE"],
"imageConfig": {
"aspectRatio": "16:9",
"imageSize": "2K"
}
}
}' | python3 -c "
import sys, json, base64
data = json.load(sys.stdin)
img_data = data['candidates'][0]['content']['parts'][0]['inlineData']['data']
sys.stdout.buffer.write(base64.b64decode(img_data))
" > gemini-native-image.png
執行成功後,當前目錄會生成 gemini-native-image.png 文件。
Python 腳本(Gemini 原生格式)
#!/usr/bin/env python3
"""Nano Banana Pro 文生圖腳本 - OpenClaw Skill(Gemini 原生格式)"""
import os, json, base64, argparse, requests
from datetime import datetime
API_KEY = os.environ.get("APIYI_API_KEY", "")
API_BASE = "https://api.apiyi.com/v1beta/models" # API易 Gemini 原生接口
def generate_image(prompt, aspect_ratio="16:9", resolution="2K"):
url = f"{API_BASE}/gemini-3-pro-image-preview:generateContent"
headers = {
"Authorization": f"Bearer {API_KEY}",
"Content-Type": "application/json"
}
data = {
"contents": [{"parts": [{"text": prompt}]}],
"generationConfig": {
"responseModalities": ["IMAGE"],
"imageConfig": {
"aspectRatio": aspect_ratio,
"imageSize": resolution
}
}
}
response = requests.post(url, headers=headers, json=data, timeout=120)
response.raise_for_status()
result = response.json()
# Gemini 原生格式:從 candidates 提取 inlineData
parts = result["candidates"][0]["content"]["parts"]
for part in parts:
if "inlineData" in part:
img_bytes = base64.b64decode(part["inlineData"]["data"])
filename = f"nano_banana_{datetime.now().strftime('%Y%m%d_%H%M%S')}.png"
with open(filename, "wb") as f:
f.write(img_bytes)
print(f"圖片已生成: {filename} ({len(img_bytes)/1024:.1f} KB)")
return filename
print("未能提取圖片數據")
return None
if __name__ == "__main__":
parser = argparse.ArgumentParser()
parser.add_argument("--prompt", required=True)
parser.add_argument("--aspect-ratio", default="16:9")
parser.add_argument("--resolution", default="2K", help="分辨率: 1K/2K/4K")
args = parser.parse_args()
generate_image(args.prompt, args.aspect_ratio, args.resolution)
🚀 快速開始: 上面的代碼使用 API易 apiyi.com 的 Gemini 原生格式接口,端點爲
/v1beta/models/{model}:generateContent,響應結構與 Google 官方完全一致。在 API易 控制檯: api.apiyi.com 創建 Key 即可開始使用。
第四步:編寫圖片編輯腳本 edit.py
Nano Banana Pro 不僅能生成圖片,還支持對已有圖片進行編輯。
#!/usr/bin/env python3
"""Nano Banana Pro 圖片編輯腳本 - OpenClaw Skill(Gemini 原生格式)"""
import os, json, base64, argparse, requests
from datetime import datetime
API_KEY = os.environ.get("APIYI_API_KEY", "")
API_BASE = "https://api.apiyi.com/v1beta/models"
def edit_image(instruction, image_url, extra_images=None):
url = f"{API_BASE}/gemini-3-pro-image-preview:generateContent"
headers = {"Authorization": f"Bearer {API_KEY}", "Content-Type": "application/json"}
# 構建 Gemini 原生格式的多模態 parts
parts = [{"text": instruction}]
# 將圖片 URL 轉爲 base64 內聯數據
img_resp = requests.get(image_url, timeout=30)
parts.append({"inlineData": {"mimeType": "image/png",
"data": base64.b64encode(img_resp.content).decode()}})
if extra_images: # 支持多圖合成(最多 14 張參考圖)
for img_url in extra_images[:13]:
r = requests.get(img_url, timeout=30)
parts.append({"inlineData": {"mimeType": "image/png",
"data": base64.b64encode(r.content).decode()}})
data = {
"contents": [{"parts": parts}],
"generationConfig": {"responseModalities": ["IMAGE"]}
}
response = requests.post(url, headers=headers, json=data, timeout=120)
response.raise_for_status()
result_parts = response.json()["candidates"][0]["content"]["parts"]
for part in result_parts:
if "inlineData" in part:
filename = f"edited_{datetime.now().strftime('%Y%m%d_%H%M%S')}.png"
with open(filename, "wb") as f:
f.write(base64.b64decode(part["inlineData"]["data"]))
print(f"編輯完成: {filename}")
return filename
return None
if __name__ == "__main__":
parser = argparse.ArgumentParser()
parser.add_argument("--instruction", required=True)
parser.add_argument("--image-url", required=True)
parser.add_argument("--extra-images", nargs="*")
args = parser.parse_args()
edit_image(args.instruction, args.image_url, args.extra_images)
圖片編輯能力總結
| 編輯類型 | 指令示例 | 處理時間 |
|---|---|---|
| 背景替換 | "Remove background and add sunset" | ~10 秒 |
| 風格轉換 | "Convert to anime style" | ~15 秒 |
| 元素添加 | "Add sunglasses to the person" | ~10 秒 |
| 多圖合成 | "Combine these logos and add…" | ~20 秒 |
| 文字添加 | "Add title text: Hello World" | ~10 秒 |
| 色彩調整 | "Make the image warmer, increase contrast" | ~8 秒 |
第五步:配置 OpenClaw 並測試
配置 API Key
在 OpenClaw 配置文件 ~/.openclaw/openclaw.json 中添加 Skill 配置:
{
"skills": {
"entries": {
"nano-banana-pro": {
"enabled": true,
"apiKey": "sk-你的API易密鑰"
}
}
}
}

測試 Skill
在消息平臺中發送測試指令驗證功能:
生成一張現代簡約風格的電商產品展示圖,白色背景,產品居中
驗證 Skill 是否正確加載:
openclaw skills list | grep nano-banana
openclaw skills test nano-banana-pro
💰 成本優化: Nano Banana Pro 通過 API易 apiyi.com 的統一定價爲 $0.05/張,不分分辨率。如果你的項目日均消耗超過 5000 張,可以享受充值加贈最高 20% 的優惠,單張成本低至 $0.04。
Nano Banana Pro API 成本與性能對比
選擇合適的接入方式對長期使用非常重要。

上方 SVG 圖表展示了詳細的定價對比和性能參數。關鍵數據:通過 API易 接入 Nano Banana Pro,單張 4K 圖片成本僅 $0.05(官方 $0.24 的 2 折),大客戶充值加贈後低至 $0.04/張,平臺日均處理 10 萬+ 張圖片,不限併發。
常見問題
Q1: OpenClaw 接入 Nano Banana Pro 需要安裝哪些依賴?
只需要 Python 3 和 requests 庫。我們通過 API易 apiyi.com 的 Gemini 原生格式接口(/v1beta/models/{model}:generateContent)調用,不需要安裝 Google 的 google-generativeai SDK。運行 pip install requests 即可。你也可以直接用 curl 命令測試,無需任何依賴。
Q2: 生成 4K 圖片時 OpenClaw 報超時怎麼辦?
Nano Banana Pro 生成 4K 圖片約需 60 秒。在 SKILL.md 的使用說明中,建議 OpenClaw 使用 exec timeout=120 或 exec timeout=180 來調用腳本,避免默認超時導致任務中斷。
Q3: 可以用其他圖片生成模型替代 Nano Banana Pro 嗎?
可以。API易 apiyi.com 平臺同時支持多種圖片生成模型。你只需修改 generate.py 中的 model 參數即可切換,API 格式完全一致,無需修改其他代碼。
Q4: 如何確保 OpenClaw Skill 的安全性?
三個關鍵措施:第一,API Key 通過環境變量注入,不要硬編碼到腳本中;第二,只使用你自己創建的 Skill,避免從 ClawHub 安裝來源不明的圖片生成技能(已有 820+ 惡意技能被發現);第三,定期檢查 OpenClaw 日誌確認沒有異常調用。
Q5: 圖片編輯支持哪些操作?效果如何?
Nano Banana Pro 支持背景替換、風格轉換、元素添加/刪除、多圖合成(最多 14 張參考圖)、文字渲染等。文字渲染是其最大優勢,單行文本錯誤率低於 10%,遠超 DALL-E 3 和 Midjourney。通過 API易 平臺調用編輯功能,單次僅需 $0.05,平均 10 秒完成。
總結
通過本教程的 5 個步驟,你已經掌握了爲 OpenClaw 創建自定義 Skill 接入 Nano Banana Pro 圖片 API 的完整流程:
- 創建 Skill 目錄 — 標準的
SKILL.md+scripts/結構 - 編寫 SKILL.md — 聲明依賴、環境變量和使用指令
- 編寫文生圖腳本 — 通過 API易 Gemini 原生格式接口調用 Nano Banana Pro
- 編寫編輯腳本 — 支持多圖合成、背景替換、風格轉換
- 配置和測試 — 在
openclaw.json中設置 Key,驗證功能
推薦通過 API易 apiyi.com 接入 Nano Banana Pro,享受統一 $0.05/張的定價(官方 4K 的 2 折),支持 Claude、GPT-4o、DeepSeek 等多模型統一接口,還可以在 imagen.apiyi.com 免費體驗出圖效果。
本文由 APIYI 技術團隊撰寫,關注 AI 大模型 API 接入實踐和 Agent 開發教程。更多技術指南請訪問 API易幫助中心: help.apiyi.com
