
想让 OpenClaw 学会直接调用 OpenAI 最强图像模型 gpt-image-2,你会先想到怎么做?大多数人第一反应是打开编辑器,写一个 requests.post(...) 的 Python 脚本,再把它封装成工具函数喂给 Agent。
这条路不是不能走,但它会让你立刻陷入四个麻烦:
- 要处理 multipart/form-data 上传参考图
- 要写重试/超时/429 限流逻辑
- 要为每个场景(文生图、图生图、Mask、批量)分别写一套封装
- 每换一个 OpenClaw 客户端(或 Claude Code、Cursor),都得重新集成一次
2026 年的答案已经变了:不要写代码,装 Skill 就好。
OpenClaw 支持完整的 Skills 生态——ClawHub 注册表目前已有 5700+ 社区贡献的 Skill。本文要分享的是 API易团队贡献到 expert-skills-hub 仓库的两个官方 gpt-image-2 Skill:
apiyi-gpt-image-2-gen(正转 / 精细控制,推荐)apiyi-gpt-image-2-all-gen(反转 / 经济模式)
装 Skill 只需要一行命令,配 Key 只需要一行 export,然后你就可以在 OpenClaw 里直接说"帮我画一张 4K 陶瓷杯商品图",Agent 会自动挑 Skill、填参数、落文件。
跟完这篇 OpenClaw 接入 gpt-image-2 教程,你会得到:
- 一份"写代码 vs 装 Skill"的清晰对比,知道为什么后者更优
- 两个即装即用的官方 Skill,覆盖高质量输出和经济批量两种场景
- 5 步跑通的最小示例(Node.js 和 Python 各一份)
- 三个实战命令(4K 海报 / 多图参考合成 / 批量草图)
- 在 Claude Code、Cursor 里复用同一套 Skill 的方法
一、为什么 Skills 是 OpenClaw 接入 gpt-image-2 的最优解
1.1 OpenClaw 的 Skills 体系:给 Agent 开外挂的标准方式
OpenClaw 是一个跨平台开源 AI 助手(GitHub 仓库 github.com/openclaw/openclaw),它的设计目标不是"又一个聊天框",而是"给 Agent 提供一套可组合的工具箱"。这套工具箱的基本单元就叫 Skill。
一个 Skill 本质上是:
skill-package/
├── SKILL.md # 告诉 Agent 这个 Skill 是做什么的
├── scripts/
│ ├── generate_image.js # Node.js 运行时
│ └── generate_image.py # Python 运行时
└── requirements.txt / package.json
当你说"帮我画一张咖啡杯",OpenClaw 会:
- 扫描所有已安装 Skill 的
SKILL.md摘要 - 判断"图像生成"最匹配
apiyi-gpt-image-2-gen - 从你的自然语言里抽取参数(尺寸、质量、输出格式)
- 调用对应的
generate_image.js/py - 把生成的图片路径返回给你
整个过程你不写代码、不配路由、不调 SDK,这是 OpenClaw 生态相对传统"写插件"模式的核心优势。
1.2 写代码 vs 装 Skill:一张表看清楚
| 对比维度 | 手写 HTTP 代码 | 安装官方 Skill |
|---|---|---|
| 起步成本 | 30 分钟起步 | 1 行命令,30 秒 |
| HTTP 细节 | 自己处理 multipart、重试、超时 | Skill 内部已封装 |
| 参考图上传 | 自己做 base64 编码 | 直接传文件路径 |
| 多运行时 | 要么 Node 要么 Python | Node.js + Python 都有 |
| Agent 感知 | 要自己写工具描述 | SKILL.md 自带 |
| 跨客户端 | 换一次环境重集成 | Claude Code / Cursor / OpenClaw 通吃 |
| 升级路径 | 自己追 OpenAI API 更新 | npx skills update 一键 |
| 线路切换 | 改代码 | 改环境变量 |
换句话说,写代码是让你自己变成一个永远在维护的 glue 工人,而装 Skill 是把维护工作交给专门的 Skill 作者。
1.3 两个 Skill 的分工:先选对工具再出图
API易团队向 expert-skills-hub 仓库贡献了两个针对 gpt-image-2 的 Skill,它们面向完全不同的场景:
| Skill 名 | 模型别名 | 定位 | 价格模式 | 最佳场景 |
|---|---|---|---|---|
apiyi-gpt-image-2-gen |
gpt-image-2 |
正转 / 精细控制 | 按 token 计费 | 海报、商拍、封面、4K 出图 |
apiyi-gpt-image-2-all-gen |
gpt-image-2-all |
反转 / 经济模式 | 固定 $0.03/图 | 批量概念稿、中文 prompt、草图探索 |
两个 Skill 共享同一个 APIYI_API_KEY,后端统一走 API易网关。你可以同时装两个,让 OpenClaw Agent 根据场景自动选:生成海报走正转,跑 100 张变体走反转。

1.4 底层后端:API易 apiyi.com 三线路
两个 Skill 的 HTTP 请求默认打到 api.apiyi.com,这是 API易的主站。
🎯 线路建议:我们建议在生产环境中把 OpenClaw 的
APIYI_BASE_URL切到 API易 apiyi.com 的高并发线路vip.apiyi.com,特别是批量跑图时。主站api.apiyi.com适合日常单图调用,VIP 线路vip.apiyi.com适合批量/夜间队列,b.apiyi.com则作为备用 fallback 自动生效。三条线路共用一把 Key,只需改一个环境变量就能切换。
二、5 分钟完成 OpenClaw 接入 gpt-image-2

2.1 前置环境检查
在 OpenClaw 接入 gpt-image-2 之前,先确认环境就绪:
| 项 | 要求 | 验证命令 |
|---|---|---|
| OpenClaw 已安装 | 最新版 | openclaw --version |
| Node.js | 18+ | node --version |
| Python | 3.10+(可选) | python3 --version |
| npx | 随 Node 自带 | npx --version |
| 网络 | 能访问 github.com 和 api.apiyi.com | curl -I api.apiyi.com |
| API易 Key | 从 api.apiyi.com 控制台获取 |
看 sk- 前缀 |
⚠️ 注意:如果
npx skills命令在你的 OpenClaw 版本里找不到,请升级到最新版(openclaw update)。Skills CLI 是 OpenClaw 2026 生态的核心能力,旧版可能没有。
2.2 Step 1:一行命令装 Skill
打开终端,根据你的主要使用场景装对应 Skill。推荐两个都装:
# 正转(推荐日常使用)
npx skills add https://github.com/wuchubuzai2018/expert-skills-hub \
--skill apiyi-gpt-image-2-gen
# 反转(批量/中文 prompt 友好)
npx skills add https://github.com/wuchubuzai2018/expert-skills-hub \
--skill apiyi-gpt-image-2-all-gen
命令完成后,Skill 会被放置到 OpenClaw 的默认 Skill 目录(通常是 ~/.openclaw/skills/)。你可以用下面的命令确认:
npx skills list
# 预期输出:
# - apiyi-gpt-image-2-gen ✓ installed
# - apiyi-gpt-image-2-all-gen ✓ installed
2.3 Step 2:配置 API 密钥
OpenClaw 接入 gpt-image-2 只需要一个环境变量:
# macOS / Linux
export APIYI_API_KEY="sk-your-key-here"
# Windows PowerShell
$env:APIYI_API_KEY = "sk-your-key-here"
建议把这行写进 ~/.zshrc / ~/.bashrc 做持久化。
🎯 拿 Key 步骤:访问 API易
apiyi.com,注册后进入控制台 → API Keys → 新建密钥。建议开启"用量上限"功能,给 OpenClaw 用的 Key 单独设置日上限(如 ¥50),避免 Agent 误触发消耗过大。
可选的三线路切换,如果你在批量场景需要高并发:
export APIYI_BASE_URL="https://vip.apiyi.com/v1" # VIP 线路
# 或
export APIYI_BASE_URL="https://b.apiyi.com/v1" # 备用
不设置时默认走 https://api.apiyi.com/v1。
2.4 Step 3:跑第一张图(Node.js)
Skill 安装完自带示例脚本。最简单的验证命令:
cd ~/.openclaw/skills/apiyi-gpt-image-2-gen
node scripts/generate_image.js \
-p "A minimalist poster with the text 'HELLO 2026' centered" \
-s "1024x1024" \
-q "medium" \
-o "png" \
-f "./hello_2026.png"
大约 20–40 秒后终端会提示:
✔ Image generated: ./hello_2026.png (1024x1024, png, 312 KB)
打开 hello_2026.png,应该能看到一张干净的极简海报,中间是清晰的 "HELLO 2026" 文字。看到文字不糊就说明整条链路(OpenClaw Skill → API易 api.apiyi.com → OpenAI gpt-image-2)已经通了。
2.5 Step 4:跑第一张图(Python 版)
如果你的项目是 Python 技术栈,同一个 Skill 也带了 Python 脚本:
cd ~/.openclaw/skills/apiyi-gpt-image-2-gen
python3 scripts/generate_image.py \
-p "A minimalist poster with the text 'HELLO 2026' centered" \
-s "1024x1024" \
-q "medium" \
-o "png" \
-f "./hello_2026.png"
参数与 Node.js 版完全一致,-p/-s/-q/-o/-f 五个短选项或对应的长选项(--prompt/--size/--quality/--output-format/--filename)。
💡 无需切换运行时:同一个 Skill 包里两个脚本并存,意味着你可以在同一个项目里一部分代码用 Node(前端友好)、一部分代码用 Python(数据科学友好),OpenClaw 接入 gpt-image-2 的 Skill 对两边都是对等公民。
2.6 Step 5:在 OpenClaw 里自然语言调用
上面的 CLI 只是验证 Skill 可用。真正的用法是让 OpenClaw 自主调用。启动 OpenClaw 后,直接用自然语言下达:
用户: 帮我用 gpt-image-2 画一张 4K 的陶瓷茶杯商品图,
早晨柔光,素色背景,PNG 格式,保存到 ./output/tea_cup.png
OpenClaw: 好的,我选用 apiyi-gpt-image-2-gen Skill 处理这个请求。
参数: size=3840x2160, quality=high, output-format=png
正在生成...
✔ 完成: ./output/tea_cup.png (3840x2160, 2.4 MB)
OpenClaw 的推理层会:
- 识别任务类型 = 图像生成
- 比较两个 Skill 的
SKILL.md,选apiyi-gpt-image-2-gen(因为用户要 4K + PNG) - 把"4K"翻译成
3840x2160,"早晨柔光"并入 prompt - 执行
generate_image.js,返回文件路径
整个过程你只说了一句中文,没有任何 Python/Node 代码。这就是 OpenClaw 接入 gpt-image-2 走 Skill 路径的核心价值。
三、OpenClaw 调用 gpt-image-2 的参数速查
3.1 正转 Skill:apiyi-gpt-image-2-gen
这是精细控制型,推荐默认使用。完整参数表:
| 选项 | 长选项 | 值范围 | 默认 | 说明 |
|---|---|---|---|---|
-p |
--prompt |
文本 | 必填 | 图像描述,建议英文+中文关键词混写 |
-s |
--size |
WIDTHxHEIGHT |
1024x1024 |
任意 16 倍数,最大 3840x3840 内 |
-q |
--quality |
low/medium/high/auto | auto |
海报选 high,草图选 low |
-o |
--output-format |
png/jpeg/webp | png |
透明背景必须 png |
-c |
--output-compression |
0-100 | 85 |
仅 jpeg/webp 生效 |
-i |
--input-image |
路径(可重复) | 无 | 最多 5 张参考图 |
-m |
--mask |
路径 | 无 | 黑白 Mask,白=编辑区 |
-f |
--filename |
路径 | ./output.png |
输出文件 |
常用 size 速查:
| 用途 | 推荐 size |
|---|---|
| 微信朋友圈 | 1080x1080 |
| 小红书竖图 | 1080x1440 |
| B 站封面 | 1920x1080 |
| 博客头图 | 1600x900 |
| 4K 海报 | 3840x2160 |
| 长条 banner | 2400x800 |
| 手机壁纸 | 1170x2532 |
3.2 反转 Skill:apiyi-gpt-image-2-all-gen
这是经济批量型,按张计费约 $0.03。参数更精简:
| 选项 | 长选项 | 值范围 | 说明 |
|---|---|---|---|
-p |
--prompt |
文本 | 描述,尺寸/比例直接写进文字 |
-r |
--response-format |
url / b64_json | url 返回 24h CDN 链接,b64_json 返回 Base64 |
-i |
--input-image |
路径(可重复) | 最多 5 张参考图 |
-f |
--filename |
路径 | 输出文件(url 模式下会自动下载) |
反转 Skill 不暴露 -s/-q/-o,因为底层模型是对话式,尺寸需要通过 prompt 表达:
# 正确示范
-p "生成一张 16:9 横版壁纸,科幻城市夜景,霓虹灯光"
# 错误示范(反转模式不支持 -s)
-p "科幻城市夜景" -s "1920x1080" # ❌
3.3 三个实战命令
实战 1:4K 电影海报(正转)
node scripts/generate_image.js \
-p "Cinematic poster for sci-fi novel 'NEON HORIZON', \
dark blue and magenta gradient sky, lone silhouette on cliff, \
bold serif title centered at top, subtle tagline bottom, \
35mm film grain" \
-s "3840x5760" \
-q "high" \
-o "png" \
-f "./poster_neon_horizon.png"
- 2:3 竖版 4K
- quality=high 确保文字锐利
- 大约 3–5 分钟出图(4K 生成时间与 quality 强相关)
实战 2:Mask 局部重绘(正转 + 图+Mask)
node scripts/generate_image.js \
-p "Replace the background with luxurious white marble countertop, \
soft natural window light from the left, \
keep product subject pixel-stable" \
-i "./coffee_cup.png" \
-m "./coffee_cup_mask.png" \
-s "2048x2048" \
-q "high" \
-f "./coffee_cup_marble.png"
- 白色像素 = 要换的背景
- 黑色像素 = 商品本体(像素稳定)
- gpt-image-2 不会破坏商品形状
实战 3:批量概念稿(反转 + 循环)
# 100 个服装概念,每张 $0.03,总成本约 $3
for i in $(seq 1 100); do
node scripts/generate_image.js \
-p "赛博朋克角色设计稿 #${i},改良汉服,霓虹色调,全身立绘" \
-r "url" \
-f "./concepts/concept_${i}.png"
done
- 反转 Skill 对中文 prompt 支持更稳
-r url模式下脚本会自动下载到本地- 批量场景建议切
APIYI_BASE_URL=https://vip.apiyi.com/v1
四、OpenClaw 接入 gpt-image-2 的进阶组合
4.1 让 Agent 自主选 Skill
同时装了正转和反转后,OpenClaw 会根据你的语言自动选。帮助 Agent 选得更准,可以在说话时带上提示词信号:
| 你的说法 | Agent 倾向选择 |
|---|---|
| "高质量"、"4K"、"海报"、"商拍" | 正转 apiyi-gpt-image-2-gen |
| "草图"、"批量"、"概念稿"、"中文" | 反转 apiyi-gpt-image-2-all-gen |
| "先出 10 张看看" | 反转(经济) |
| "用 Mask 改背景" | 正转(反转不支持 Mask) |
| "固定 $0.03 一张" | 反转 |
🎯 提示词技巧:在关键词里写"精细控制"或"经济批量"这类术语,OpenClaw 几乎 100% 命中对应 Skill。在
docs.apiyi.com的 Skills 生态专栏里还能找到更多触发词样例。
4.2 Skill 链:生成图 → OCR → 翻译
因为 Skill 之间可以被 Agent 自由编排,OpenClaw 接入 gpt-image-2 可以串成多步流水线。示例:"生成一张带英文标语的海报,然后把标语翻译成日语版":
用户: 生成一张带 "Less is more" 英文标语的极简海报,
然后生成同构图但标语换成日语的版本
OpenClaw:
Step 1: apiyi-gpt-image-2-gen (英文版)
→ ./en_poster.png
Step 2: apiyi-gpt-image-2-gen (日语版,以 en_poster.png 为参考图)
-i ./en_poster.png
-p "Same layout, replace text with 'より少なく、より豊かに'"
→ ./jp_poster.png
这是 Skill 生态最强大的地方:单个 Skill 做一件事,Agent 负责把它们串成任意复杂度的工作流。
4.3 把 Skill 封装进 CI/CD
两个 Skill 的脚本本质是标准 CLI,意味着它们能无缝进入 CI/CD:
# .github/workflows/generate-og-image.yml
name: Generate OG image on release
on:
release:
types: [published]
jobs:
og-image:
runs-on: ubuntu-latest
steps:
- uses: actions/checkout@v4
- uses: actions/setup-node@v4
with: { node-version: '20' }
- run: npx skills add https://github.com/wuchubuzai2018/expert-skills-hub --skill apiyi-gpt-image-2-gen
- env:
APIYI_API_KEY: ${{ secrets.APIYI_API_KEY }}
run: |
node ~/.openclaw/skills/apiyi-gpt-image-2-gen/scripts/generate_image.js \
-p "Release ${{ github.event.release.tag_name }} cover image" \
-s "1200x630" \
-q "high" \
-f "./og-image.png"
- uses: actions/upload-artifact@v4
with: { name: og-image, path: ./og-image.png }
每次发 release 自动生成 OG 图,Agent 和 CI 共享同一套 Skill 定义。
4.4 在 Claude Code 和 Cursor 里复用
本文虽然聚焦 OpenClaw,但 apiyi-gpt-image-2-gen / apiyi-gpt-image-2-all-gen 两个 Skill 完全遵循通用 Skills 标准,所以:
| 客户端 | 是否支持 | 备注 |
|---|---|---|
| OpenClaw | ✅ | 本文主场景 |
| Claude Code | ✅ | 放到 ~/.claude/skills/ 即可 |
| Cursor | ✅ | 通过 Rules 文件引用 |
| Windsurf | ✅ | Skill 规范兼容 |
| 自建 Agent(LangChain 等) | ⚠️ | 需要包一层 Tool Adapter |
"一次安装,多客户端复用"让你的图像生成能力可以跟着主力工具迁移,不用每次重写。
五、OpenClaw 接入 gpt-image-2 常见问题 FAQ
Q1:npx skills add 报 "command not found"?
确保 OpenClaw 已升级到最新版(openclaw update),旧版没有 Skills CLI。如果仍然报错,可以手动克隆仓库到 ~/.openclaw/skills/ 目录作为兜底。
Q2:跑脚本提示 "APIYI_API_KEY is not set"?
三步排查:
echo $APIYI_API_KEY看变量是否导出成功- 确认 Key 带
sk-前缀 - 如果刚写入
~/.zshrc,开个新终端让它生效
Q3:如何把调用切到 vip.apiyi.com 高并发线路?
两种方式:
# 方式 1:全局环境变量
export APIYI_BASE_URL="https://vip.apiyi.com/v1"
# 方式 2:单次调用前缀
APIYI_BASE_URL="https://vip.apiyi.com/v1" node scripts/generate_image.js ...
备用域名同理:b.apiyi.com。三个域名共用同一把 Key,主站抖动时手工切到 VIP 通常能立刻恢复,具体策略也可以参考 API易官方文档 docs.apiyi.com 的线路切换指南。
Q4:反转和正转到底怎么选?
对照这张决策表:
| 如果你需要… | 选 |
|---|---|
精确控制分辨率(比如 1920x1080) |
正转 |
| 使用 Mask 局部重绘 | 正转 |
| 4K 以上高质量海报 | 正转 |
| 批量跑 50+ 张 | 反转 |
| 中文 prompt 占主导 | 反转 |
| 成本可预测($0.03/张) | 反转 |
最省心的做法:两个都装,让 OpenClaw Agent 根据你的自然语言自动选。
Q5:能在 Claude Code 里用吗?
可以。把 Skill 包从 ~/.openclaw/skills/ 软链接或复制到 ~/.claude/skills/,Claude Code 会自动识别 SKILL.md 并把它注册为可调用工具。同一把 APIYI_API_KEY 共用。
Q6:Skill 安全吗?
社区 Skill 生态需要警惕。2026 年 2 月曾曝出 341 个恶意 Skill 通过 ClawHub 分发 Atomic Stealer 恶意软件。建议:
- 只装来自可信仓库的 Skill(本文的
wuchubuzai2018/expert-skills-hub是 API易官方源) - 安装后审阅
SKILL.md和 scripts 内容,尤其注意curl | bash或连接陌生域名的代码 - 用
npx skills inspect <skill-name>查看 Skill 会访问哪些网络地址
官方 API易 Skill 的所有请求都只打向 *.apiyi.com,可以安全审计。
Q7:4K 出图很慢怎么办?
- 正常现象。
quality=high+3840x2160大约需要 3–5 分钟 - 在脚本外层加超时保护(Bash 里
timeout 360 node ...) - 如果需要快速预览,先用
size=2048x1152 quality=medium出草图,确认效果再升 4K
Q8:如何做成本监控?
在 API易 apiyi.com 控制台开启「日预算告警」和「按 Key 统计」。给 OpenClaw 专用 Key 单独设额度,既能观察消耗,也能在意外情况下及时停损。
六、OpenClaw 接入 gpt-image-2 总结
回过头看,OpenClaw 接入 gpt-image-2 在 2026 年的最佳路径已经从"写代码"转向"装 Skill"。原因非常朴素:
- 更快:
npx skills add+export KEY两条命令,30 秒完成 - 更稳:HTTP 细节、重试策略、参数校验全都封在 Skill 里,升级跟着 Skill 作者走
- 更广:同一个 Skill 在 OpenClaw / Claude Code / Cursor 里通用
- 更聪明:Agent 看得懂
SKILL.md,能自己决定什么时候用、用哪一个
API易贡献的两个 Skill apiyi-gpt-image-2-gen(精细控制)与 apiyi-gpt-image-2-all-gen(经济批量)正好覆盖了最常见的两类场景。同时安装它们就是目前最省心的起点——后续不管是 4K 海报还是 100 张概念稿,OpenClaw Agent 都能自动选对 Skill。
🎯 落地建议:先去 API易
apiyi.com申请一把测试 Key(建议设置 ¥20–50 的日上限),按本文 §2 的 5 步跑通最小示例;确认链路通畅后,回到 §3 的实战命令尝试 4K 海报和 Mask 重绘;遇到线路抖动时随时把APIYI_BASE_URL切到vip.apiyi.com或b.apiyi.com。需要更复杂的 Skill 组合或 CI/CD 样例,可以查阅 API易官方文档docs.apiyi.com的 Skills 生态专栏。
至此,你已经拥有一套完整的、跨客户端可复用的 OpenClaw gpt-image-2 接入方案。接下来要做的唯一事情,就是把"写一个图像调用工具"这件事从你的 todo list 上永久删掉——交给 Skill 就好。
作者: API易技术团队
相关资源:
- Skills 仓库: github.com/wuchubuzai2018/expert-skills-hub
- OpenClaw 主页: github.com/openclaw/openclaw
- API易官网: apiyi.com
- API易文档: docs.apiyi.com
- API易主站: api.apiyi.com(备用 vip.apiyi.com / b.apiyi.com)
