OpenClaw 接入 gpt-image-2 最佳方案：用 Skills 5 分钟跑通，不写一行 HTTP 代码

想让 OpenClaw 学会直接调用 OpenAI 最强图像模型 gpt-image-2，你会先想到怎么做？大多数人第一反应是打开编辑器，写一个 requests.post(...) 的 Python 脚本，再把它封装成工具函数喂给 Agent。

这条路不是不能走，但它会让你立刻陷入四个麻烦：

要处理 multipart/form-data 上传参考图
要写重试/超时/429 限流逻辑
要为每个场景（文生图、图生图、Mask、批量）分别写一套封装
每换一个 OpenClaw 客户端（或 Claude Code、Cursor），都得重新集成一次

2026 年的答案已经变了：不要写代码，装 Skill 就好。

OpenClaw 支持完整的 Skills 生态——ClawHub 注册表目前已有 5700+ 社区贡献的 Skill。本文要分享的是 API易团队贡献到 expert-skills-hub 仓库的两个官方 gpt-image-2 Skill：

apiyi-gpt-image-2-gen（正转 / 精细控制，推荐）
apiyi-gpt-image-2-all-gen（反转 / 经济模式）

装 Skill 只需要一行命令，配 Key 只需要一行 export，然后你就可以在 OpenClaw 里直接说"帮我画一张 4K 陶瓷杯商品图"，Agent 会自动挑 Skill、填参数、落文件。

跟完这篇 OpenClaw 接入 gpt-image-2 教程，你会得到：

一份"写代码 vs 装 Skill"的清晰对比，知道为什么后者更优
两个即装即用的官方 Skill，覆盖高质量输出和经济批量两种场景
5 步跑通的最小示例（Node.js 和 Python 各一份）
三个实战命令（4K 海报 / 多图参考合成 / 批量草图）
在 Claude Code、Cursor 里复用同一套 Skill 的方法

一、为什么 Skills 是 OpenClaw 接入 gpt-image-2 的最优解

1.1 OpenClaw 的 Skills 体系：给 Agent 开外挂的标准方式

OpenClaw 是一个跨平台开源 AI 助手（GitHub 仓库 github.com/openclaw/openclaw），它的设计目标不是"又一个聊天框"，而是"给 Agent 提供一套可组合的工具箱"。这套工具箱的基本单元就叫 Skill。

一个 Skill 本质上是：

skill-package/
├── SKILL.md                # 告诉 Agent 这个 Skill 是做什么的
├── scripts/
│   ├── generate_image.js   # Node.js 运行时
│   └── generate_image.py   # Python 运行时
└── requirements.txt / package.json

当你说"帮我画一张咖啡杯"，OpenClaw 会：

扫描所有已安装 Skill 的 SKILL.md 摘要
判断"图像生成"最匹配 apiyi-gpt-image-2-gen
从你的自然语言里抽取参数（尺寸、质量、输出格式）
调用对应的 generate_image.js/py
把生成的图片路径返回给你

整个过程你不写代码、不配路由、不调 SDK，这是 OpenClaw 生态相对传统"写插件"模式的核心优势。

1.2 写代码 vs 装 Skill：一张表看清楚

对比维度	手写 HTTP 代码	安装官方 Skill
起步成本	30 分钟起步	1 行命令，30 秒
HTTP 细节	自己处理 multipart、重试、超时	Skill 内部已封装
参考图上传	自己做 base64 编码	直接传文件路径
多运行时	要么 Node 要么 Python	Node.js + Python 都有
Agent 感知	要自己写工具描述	`SKILL.md` 自带
跨客户端	换一次环境重集成	Claude Code / Cursor / OpenClaw 通吃
升级路径	自己追 OpenAI API 更新	`npx skills update` 一键
线路切换	改代码	改环境变量

换句话说，写代码是让你自己变成一个永远在维护的 glue 工人，而装 Skill 是把维护工作交给专门的 Skill 作者。

1.3 两个 Skill 的分工：先选对工具再出图

API易团队向 expert-skills-hub 仓库贡献了两个针对 gpt-image-2 的 Skill，它们面向完全不同的场景：

Skill 名	模型别名	定位	价格模式	最佳场景
`apiyi-gpt-image-2-gen`	`gpt-image-2`	正转 / 精细控制	按 token 计费	海报、商拍、封面、4K 出图
`apiyi-gpt-image-2-all-gen`	`gpt-image-2-all`	反转 / 经济模式	固定 $0.03/图	批量概念稿、中文 prompt、草图探索

两个 Skill 共享同一个 APIYI_API_KEY，后端统一走 API易网关。你可以同时装两个，让 OpenClaw Agent 根据场景自动选：生成海报走正转，跑 100 张变体走反转。

1.4 底层后端：API易 apiyi.com 三线路

两个 Skill 的 HTTP 请求默认打到 api.apiyi.com，这是 API易的主站。

🎯 线路建议：我们建议在生产环境中把 OpenClaw 的 APIYI_BASE_URL 切到 API易 apiyi.com 的高并发线路 vip.apiyi.com，特别是批量跑图时。主站 api.apiyi.com 适合日常单图调用，VIP 线路 vip.apiyi.com 适合批量/夜间队列，b.apiyi.com 则作为备用 fallback 自动生效。三条线路共用一把 Key，只需改一个环境变量就能切换。

二、5 分钟完成 OpenClaw 接入 gpt-image-2

2.1 前置环境检查

在 OpenClaw 接入 gpt-image-2 之前，先确认环境就绪：

项	要求	验证命令
OpenClaw 已安装	最新版	`openclaw --version`
Node.js	18+	`node --version`
Python	3.10+（可选）	`python3 --version`
npx	随 Node 自带	`npx --version`
网络	能访问 github.com 和 api.apiyi.com	`curl -I api.apiyi.com`
API易 Key	从 `api.apiyi.com` 控制台获取	看 `sk-` 前缀

⚠️ 注意：如果 npx skills 命令在你的 OpenClaw 版本里找不到，请升级到最新版（openclaw update）。Skills CLI 是 OpenClaw 2026 生态的核心能力，旧版可能没有。

2.2 Step 1：一行命令装 Skill

打开终端，根据你的主要使用场景装对应 Skill。推荐两个都装：

# 正转（推荐日常使用）
npx skills add https://github.com/wuchubuzai2018/expert-skills-hub \
  --skill apiyi-gpt-image-2-gen

# 反转（批量/中文 prompt 友好）
npx skills add https://github.com/wuchubuzai2018/expert-skills-hub \
  --skill apiyi-gpt-image-2-all-gen

命令完成后，Skill 会被放置到 OpenClaw 的默认 Skill 目录（通常是 ~/.openclaw/skills/）。你可以用下面的命令确认：

npx skills list
# 预期输出:
# - apiyi-gpt-image-2-gen       ✓ installed
# - apiyi-gpt-image-2-all-gen   ✓ installed

2.3 Step 2：配置 API 密钥

OpenClaw 接入 gpt-image-2 只需要一个环境变量：

# macOS / Linux
export APIYI_API_KEY="sk-your-key-here"

# Windows PowerShell
$env:APIYI_API_KEY = "sk-your-key-here"

建议把这行写进 ~/.zshrc / ~/.bashrc 做持久化。

🎯 拿 Key 步骤：访问 API易 apiyi.com，注册后进入控制台 → API Keys → 新建密钥。建议开启"用量上限"功能，给 OpenClaw 用的 Key 单独设置日上限（如 ¥50），避免 Agent 误触发消耗过大。

可选的三线路切换，如果你在批量场景需要高并发：

export APIYI_BASE_URL="https://vip.apiyi.com/v1"   # VIP 线路
# 或
export APIYI_BASE_URL="https://b.apiyi.com/v1"     # 备用

不设置时默认走 https://api.apiyi.com/v1。

2.4 Step 3：跑第一张图（Node.js）

Skill 安装完自带示例脚本。最简单的验证命令：

cd ~/.openclaw/skills/apiyi-gpt-image-2-gen

node scripts/generate_image.js \
  -p "A minimalist poster with the text 'HELLO 2026' centered" \
  -s "1024x1024" \
  -q "medium" \
  -o "png" \
  -f "./hello_2026.png"

大约 20–40 秒后终端会提示：

✔ Image generated: ./hello_2026.png (1024x1024, png, 312 KB)

打开 hello_2026.png，应该能看到一张干净的极简海报，中间是清晰的 "HELLO 2026" 文字。看到文字不糊就说明整条链路（OpenClaw Skill → API易 api.apiyi.com → OpenAI gpt-image-2）已经通了。

2.5 Step 4：跑第一张图（Python 版）

如果你的项目是 Python 技术栈，同一个 Skill 也带了 Python 脚本：

cd ~/.openclaw/skills/apiyi-gpt-image-2-gen

python3 scripts/generate_image.py \
  -p "A minimalist poster with the text 'HELLO 2026' centered" \
  -s "1024x1024" \
  -q "medium" \
  -o "png" \
  -f "./hello_2026.png"

参数与 Node.js 版完全一致，-p/-s/-q/-o/-f 五个短选项或对应的长选项（--prompt/--size/--quality/--output-format/--filename）。

💡 无需切换运行时：同一个 Skill 包里两个脚本并存，意味着你可以在同一个项目里一部分代码用 Node（前端友好）、一部分代码用 Python（数据科学友好），OpenClaw 接入 gpt-image-2 的 Skill 对两边都是对等公民。

2.6 Step 5：在 OpenClaw 里自然语言调用

上面的 CLI 只是验证 Skill 可用。真正的用法是让 OpenClaw 自主调用。启动 OpenClaw 后，直接用自然语言下达：

用户: 帮我用 gpt-image-2 画一张 4K 的陶瓷茶杯商品图，
      早晨柔光，素色背景，PNG 格式，保存到 ./output/tea_cup.png

OpenClaw: 好的，我选用 apiyi-gpt-image-2-gen Skill 处理这个请求。
         参数: size=3840x2160, quality=high, output-format=png
         正在生成...
         ✔ 完成: ./output/tea_cup.png (3840x2160, 2.4 MB)

OpenClaw 的推理层会：

识别任务类型 = 图像生成
比较两个 Skill 的 SKILL.md，选 apiyi-gpt-image-2-gen（因为用户要 4K + PNG）
把"4K"翻译成 3840x2160，"早晨柔光"并入 prompt
执行 generate_image.js，返回文件路径

整个过程你只说了一句中文，没有任何 Python/Node 代码。这就是 OpenClaw 接入 gpt-image-2 走 Skill 路径的核心价值。

三、OpenClaw 调用 gpt-image-2 的参数速查

3.1 正转 Skill：apiyi-gpt-image-2-gen

这是精细控制型，推荐默认使用。完整参数表：

选项	长选项	值范围	默认	说明
`-p`	`--prompt`	文本	必填	图像描述，建议英文+中文关键词混写
`-s`	`--size`	`WIDTHxHEIGHT`	`1024x1024`	任意 16 倍数，最大 `3840x3840` 内
`-q`	`--quality`	low/medium/high/auto	`auto`	海报选 high，草图选 low
`-o`	`--output-format`	png/jpeg/webp	`png`	透明背景必须 png
`-c`	`--output-compression`	0-100	`85`	仅 jpeg/webp 生效
`-i`	`--input-image`	路径（可重复）	无	最多 5 张参考图
`-m`	`--mask`	路径	无	黑白 Mask，白=编辑区
`-f`	`--filename`	路径	`./output.png`	输出文件

常用 size 速查：

用途	推荐 size
微信朋友圈	`1080x1080`
小红书竖图	`1080x1440`
B 站封面	`1920x1080`
博客头图	`1600x900`
4K 海报	`3840x2160`
长条 banner	`2400x800`
手机壁纸	`1170x2532`

3.2 反转 Skill：apiyi-gpt-image-2-all-gen

这是经济批量型，按张计费约 $0.03。参数更精简：

选项	长选项	值范围	说明
`-p`	`--prompt`	文本	描述，尺寸/比例直接写进文字
`-r`	`--response-format`	url / b64_json	`url` 返回 24h CDN 链接，`b64_json` 返回 Base64
`-i`	`--input-image`	路径（可重复）	最多 5 张参考图
`-f`	`--filename`	路径	输出文件（`url` 模式下会自动下载）

反转 Skill 不暴露 -s/-q/-o，因为底层模型是对话式，尺寸需要通过 prompt 表达：

# 正确示范
-p "生成一张 16:9 横版壁纸，科幻城市夜景，霓虹灯光"

# 错误示范（反转模式不支持 -s）
-p "科幻城市夜景" -s "1920x1080"  # ❌

3.3 三个实战命令

实战 1：4K 电影海报（正转）

node scripts/generate_image.js \
  -p "Cinematic poster for sci-fi novel 'NEON HORIZON', \
     dark blue and magenta gradient sky, lone silhouette on cliff, \
     bold serif title centered at top, subtle tagline bottom, \
     35mm film grain" \
  -s "3840x5760" \
  -q "high" \
  -o "png" \
  -f "./poster_neon_horizon.png"

2:3 竖版 4K
quality=high 确保文字锐利
大约 3–5 分钟出图（4K 生成时间与 quality 强相关）

实战 2：Mask 局部重绘（正转 + 图+Mask）

node scripts/generate_image.js \
  -p "Replace the background with luxurious white marble countertop, \
     soft natural window light from the left, \
     keep product subject pixel-stable" \
  -i "./coffee_cup.png" \
  -m "./coffee_cup_mask.png" \
  -s "2048x2048" \
  -q "high" \
  -f "./coffee_cup_marble.png"

白色像素 = 要换的背景
黑色像素 = 商品本体（像素稳定）
gpt-image-2 不会破坏商品形状

实战 3：批量概念稿（反转 + 循环）

# 100 个服装概念，每张 $0.03，总成本约 $3
for i in $(seq 1 100); do
  node scripts/generate_image.js \
    -p "赛博朋克角色设计稿 #${i}，改良汉服，霓虹色调，全身立绘" \
    -r "url" \
    -f "./concepts/concept_${i}.png"
done

反转 Skill 对中文 prompt 支持更稳
-r url 模式下脚本会自动下载到本地
批量场景建议切 APIYI_BASE_URL=https://vip.apiyi.com/v1

四、OpenClaw 接入 gpt-image-2 的进阶组合

4.1 让 Agent 自主选 Skill

同时装了正转和反转后，OpenClaw 会根据你的语言自动选。帮助 Agent 选得更准，可以在说话时带上提示词信号：

你的说法	Agent 倾向选择
"高质量"、"4K"、"海报"、"商拍"	正转 `apiyi-gpt-image-2-gen`
"草图"、"批量"、"概念稿"、"中文"	反转 `apiyi-gpt-image-2-all-gen`
"先出 10 张看看"	反转（经济）
"用 Mask 改背景"	正转（反转不支持 Mask）
"固定 $0.03 一张"	反转

🎯 提示词技巧：在关键词里写"精细控制"或"经济批量"这类术语，OpenClaw 几乎 100% 命中对应 Skill。在 docs.apiyi.com 的 Skills 生态专栏里还能找到更多触发词样例。

4.2 Skill 链：生成图 → OCR → 翻译

因为 Skill 之间可以被 Agent 自由编排，OpenClaw 接入 gpt-image-2 可以串成多步流水线。示例："生成一张带英文标语的海报，然后把标语翻译成日语版":

用户: 生成一张带 "Less is more" 英文标语的极简海报，
      然后生成同构图但标语换成日语的版本

OpenClaw:
  Step 1: apiyi-gpt-image-2-gen (英文版)
          → ./en_poster.png
  Step 2: apiyi-gpt-image-2-gen (日语版，以 en_poster.png 为参考图)
          -i ./en_poster.png
          -p "Same layout, replace text with 'より少なく、より豊かに'"
          → ./jp_poster.png

这是 Skill 生态最强大的地方：单个 Skill 做一件事，Agent 负责把它们串成任意复杂度的工作流。

4.3 把 Skill 封装进 CI/CD

两个 Skill 的脚本本质是标准 CLI，意味着它们能无缝进入 CI/CD：

# .github/workflows/generate-og-image.yml
name: Generate OG image on release
on:
  release:
    types: [published]

jobs:
  og-image:
    runs-on: ubuntu-latest
    steps:
      - uses: actions/checkout@v4
      - uses: actions/setup-node@v4
        with: { node-version: '20' }
      - run: npx skills add https://github.com/wuchubuzai2018/expert-skills-hub --skill apiyi-gpt-image-2-gen
      - env:
          APIYI_API_KEY: ${{ secrets.APIYI_API_KEY }}
        run: |
          node ~/.openclaw/skills/apiyi-gpt-image-2-gen/scripts/generate_image.js \
            -p "Release ${{ github.event.release.tag_name }} cover image" \
            -s "1200x630" \
            -q "high" \
            -f "./og-image.png"
      - uses: actions/upload-artifact@v4
        with: { name: og-image, path: ./og-image.png }

每次发 release 自动生成 OG 图，Agent 和 CI 共享同一套 Skill 定义。

4.4 在 Claude Code 和 Cursor 里复用

本文虽然聚焦 OpenClaw，但 apiyi-gpt-image-2-gen / apiyi-gpt-image-2-all-gen 两个 Skill 完全遵循通用 Skills 标准，所以：

客户端	是否支持	备注
OpenClaw	✅	本文主场景
Claude Code	✅	放到 `~/.claude/skills/` 即可
Cursor	✅	通过 Rules 文件引用
Windsurf	✅	Skill 规范兼容
自建 Agent（LangChain 等）	⚠️	需要包一层 Tool Adapter

"一次安装，多客户端复用"让你的图像生成能力可以跟着主力工具迁移，不用每次重写。

五、OpenClaw 接入 gpt-image-2 常见问题 FAQ

Q1：`npx skills add` 报 "command not found"？

确保 OpenClaw 已升级到最新版（openclaw update），旧版没有 Skills CLI。如果仍然报错，可以手动克隆仓库到 ~/.openclaw/skills/ 目录作为兜底。

Q2：跑脚本提示 "APIYI_API_KEY is not set"？

三步排查：

echo $APIYI_API_KEY 看变量是否导出成功
确认 Key 带 sk- 前缀
如果刚写入 ~/.zshrc，开个新终端让它生效

Q3：如何把调用切到 `vip.apiyi.com` 高并发线路？

两种方式：

# 方式 1：全局环境变量
export APIYI_BASE_URL="https://vip.apiyi.com/v1"

# 方式 2：单次调用前缀
APIYI_BASE_URL="https://vip.apiyi.com/v1" node scripts/generate_image.js ...

备用域名同理：b.apiyi.com。三个域名共用同一把 Key，主站抖动时手工切到 VIP 通常能立刻恢复，具体策略也可以参考 API易官方文档 docs.apiyi.com 的线路切换指南。

Q4：反转和正转到底怎么选？

对照这张决策表：

如果你需要…	选
精确控制分辨率（比如 `1920x1080`）	正转
使用 Mask 局部重绘	正转
4K 以上高质量海报	正转
批量跑 50+ 张	反转
中文 prompt 占主导	反转
成本可预测（$0.03/张）	反转

最省心的做法：两个都装，让 OpenClaw Agent 根据你的自然语言自动选。

Q5：能在 Claude Code 里用吗？

可以。把 Skill 包从 ~/.openclaw/skills/ 软链接或复制到 ~/.claude/skills/，Claude Code 会自动识别 SKILL.md 并把它注册为可调用工具。同一把 APIYI_API_KEY 共用。

Q6：Skill 安全吗？

社区 Skill 生态需要警惕。2026 年 2 月曾曝出 341 个恶意 Skill 通过 ClawHub 分发 Atomic Stealer 恶意软件。建议：

只装来自可信仓库的 Skill（本文的 wuchubuzai2018/expert-skills-hub 是 API易官方源）
安装后审阅 SKILL.md 和 scripts 内容，尤其注意 curl | bash 或连接陌生域名的代码
用 npx skills inspect <skill-name> 查看 Skill 会访问哪些网络地址

官方 API易 Skill 的所有请求都只打向 *.apiyi.com，可以安全审计。

Q7：4K 出图很慢怎么办？

正常现象。quality=high + 3840x2160 大约需要 3–5 分钟
在脚本外层加超时保护（Bash 里 timeout 360 node ...）
如果需要快速预览，先用 size=2048x1152 quality=medium 出草图，确认效果再升 4K

Q8：如何做成本监控？

在 API易 apiyi.com 控制台开启「日预算告警」和「按 Key 统计」。给 OpenClaw 专用 Key 单独设额度，既能观察消耗，也能在意外情况下及时停损。

六、OpenClaw 接入 gpt-image-2 总结

回过头看，OpenClaw 接入 gpt-image-2 在 2026 年的最佳路径已经从"写代码"转向"装 Skill"。原因非常朴素：

更快：npx skills add + export KEY 两条命令，30 秒完成
更稳：HTTP 细节、重试策略、参数校验全都封在 Skill 里，升级跟着 Skill 作者走
更广：同一个 Skill 在 OpenClaw / Claude Code / Cursor 里通用
更聪明：Agent 看得懂 SKILL.md，能自己决定什么时候用、用哪一个

API易贡献的两个 Skill apiyi-gpt-image-2-gen（精细控制）与 apiyi-gpt-image-2-all-gen（经济批量）正好覆盖了最常见的两类场景。同时安装它们就是目前最省心的起点——后续不管是 4K 海报还是 100 张概念稿，OpenClaw Agent 都能自动选对 Skill。

🎯 落地建议：先去 API易 apiyi.com 申请一把测试 Key（建议设置 ¥20–50 的日上限），按本文 §2 的 5 步跑通最小示例；确认链路通畅后，回到 §3 的实战命令尝试 4K 海报和 Mask 重绘；遇到线路抖动时随时把 APIYI_BASE_URL 切到 vip.apiyi.com 或 b.apiyi.com。需要更复杂的 Skill 组合或 CI/CD 样例，可以查阅 API易官方文档 docs.apiyi.com 的 Skills 生态专栏。

至此，你已经拥有一套完整的、跨客户端可复用的 OpenClaw gpt-image-2 接入方案。接下来要做的唯一事情，就是把"写一个图像调用工具"这件事从你的 todo list 上永久删掉——交给 Skill 就好。

作者: API易技术团队
相关资源:

Skills 仓库: github.com/wuchubuzai2018/expert-skills-hub
OpenClaw 主页: github.com/openclaw/openclaw
API易官网: apiyi.com
API易文档: docs.apiyi.com
API易主站: api.apiyi.com（备用 vip.apiyi.com / b.apiyi.com）