|

OpenClaw 接入 gpt-image-2 最佳方案:用 Skills 5 分钟跑通,不写一行 HTTP 代码

openclaw-gpt-image-2-skills-integration 图示

想让 OpenClaw 学会直接调用 OpenAI 最强图像模型 gpt-image-2,你会先想到怎么做?大多数人第一反应是打开编辑器,写一个 requests.post(...) 的 Python 脚本,再把它封装成工具函数喂给 Agent。

这条路不是不能走,但它会让你立刻陷入四个麻烦:

  1. 要处理 multipart/form-data 上传参考图
  2. 要写重试/超时/429 限流逻辑
  3. 要为每个场景(文生图、图生图、Mask、批量)分别写一套封装
  4. 每换一个 OpenClaw 客户端(或 Claude Code、Cursor),都得重新集成一次

2026 年的答案已经变了:不要写代码,装 Skill 就好

OpenClaw 支持完整的 Skills 生态——ClawHub 注册表目前已有 5700+ 社区贡献的 Skill。本文要分享的是 API易团队贡献到 expert-skills-hub 仓库的两个官方 gpt-image-2 Skill

  • apiyi-gpt-image-2-gen(正转 / 精细控制,推荐)
  • apiyi-gpt-image-2-all-gen(反转 / 经济模式)

装 Skill 只需要一行命令,配 Key 只需要一行 export,然后你就可以在 OpenClaw 里直接说"帮我画一张 4K 陶瓷杯商品图",Agent 会自动挑 Skill、填参数、落文件。

跟完这篇 OpenClaw 接入 gpt-image-2 教程,你会得到:

  • 一份"写代码 vs 装 Skill"的清晰对比,知道为什么后者更优
  • 两个即装即用的官方 Skill,覆盖高质量输出和经济批量两种场景
  • 5 步跑通的最小示例(Node.js 和 Python 各一份)
  • 三个实战命令(4K 海报 / 多图参考合成 / 批量草图)
  • 在 Claude Code、Cursor 里复用同一套 Skill 的方法

一、为什么 Skills 是 OpenClaw 接入 gpt-image-2 的最优解

1.1 OpenClaw 的 Skills 体系:给 Agent 开外挂的标准方式

OpenClaw 是一个跨平台开源 AI 助手(GitHub 仓库 github.com/openclaw/openclaw),它的设计目标不是"又一个聊天框",而是"给 Agent 提供一套可组合的工具箱"。这套工具箱的基本单元就叫 Skill

一个 Skill 本质上是:

skill-package/
├── SKILL.md                # 告诉 Agent 这个 Skill 是做什么的
├── scripts/
│   ├── generate_image.js   # Node.js 运行时
│   └── generate_image.py   # Python 运行时
└── requirements.txt / package.json

当你说"帮我画一张咖啡杯",OpenClaw 会:

  1. 扫描所有已安装 Skill 的 SKILL.md 摘要
  2. 判断"图像生成"最匹配 apiyi-gpt-image-2-gen
  3. 从你的自然语言里抽取参数(尺寸、质量、输出格式)
  4. 调用对应的 generate_image.js/py
  5. 把生成的图片路径返回给你

整个过程你不写代码、不配路由、不调 SDK,这是 OpenClaw 生态相对传统"写插件"模式的核心优势

1.2 写代码 vs 装 Skill:一张表看清楚

对比维度 手写 HTTP 代码 安装官方 Skill
起步成本 30 分钟起步 1 行命令,30 秒
HTTP 细节 自己处理 multipart、重试、超时 Skill 内部已封装
参考图上传 自己做 base64 编码 直接传文件路径
多运行时 要么 Node 要么 Python Node.js + Python 都有
Agent 感知 要自己写工具描述 SKILL.md 自带
跨客户端 换一次环境重集成 Claude Code / Cursor / OpenClaw 通吃
升级路径 自己追 OpenAI API 更新 npx skills update 一键
线路切换 改代码 改环境变量

换句话说,写代码是让你自己变成一个永远在维护的 glue 工人,而装 Skill 是把维护工作交给专门的 Skill 作者。

1.3 两个 Skill 的分工:先选对工具再出图

API易团队向 expert-skills-hub 仓库贡献了两个针对 gpt-image-2 的 Skill,它们面向完全不同的场景:

Skill 名 模型别名 定位 价格模式 最佳场景
apiyi-gpt-image-2-gen gpt-image-2 正转 / 精细控制 按 token 计费 海报、商拍、封面、4K 出图
apiyi-gpt-image-2-all-gen gpt-image-2-all 反转 / 经济模式 固定 $0.03/图 批量概念稿、中文 prompt、草图探索

两个 Skill 共享同一个 APIYI_API_KEY,后端统一走 API易网关。你可以同时装两个,让 OpenClaw Agent 根据场景自动选:生成海报走正转,跑 100 张变体走反转。

openclaw-gpt-image-2-skills-integration 图示

1.4 底层后端:API易 apiyi.com 三线路

两个 Skill 的 HTTP 请求默认打到 api.apiyi.com,这是 API易的主站。

🎯 线路建议:我们建议在生产环境中把 OpenClaw 的 APIYI_BASE_URL 切到 API易 apiyi.com 的高并发线路 vip.apiyi.com,特别是批量跑图时。主站 api.apiyi.com 适合日常单图调用,VIP 线路 vip.apiyi.com 适合批量/夜间队列,b.apiyi.com 则作为备用 fallback 自动生效。三条线路共用一把 Key,只需改一个环境变量就能切换。


二、5 分钟完成 OpenClaw 接入 gpt-image-2

openclaw-gpt-image-2-skills-integration 图示

2.1 前置环境检查

OpenClaw 接入 gpt-image-2 之前,先确认环境就绪:

要求 验证命令
OpenClaw 已安装 最新版 openclaw --version
Node.js 18+ node --version
Python 3.10+(可选) python3 --version
npx 随 Node 自带 npx --version
网络 能访问 github.com 和 api.apiyi.com curl -I api.apiyi.com
API易 Key api.apiyi.com 控制台获取 sk- 前缀

⚠️ 注意:如果 npx skills 命令在你的 OpenClaw 版本里找不到,请升级到最新版(openclaw update)。Skills CLI 是 OpenClaw 2026 生态的核心能力,旧版可能没有。

2.2 Step 1:一行命令装 Skill

打开终端,根据你的主要使用场景装对应 Skill。推荐两个都装

# 正转(推荐日常使用)
npx skills add https://github.com/wuchubuzai2018/expert-skills-hub \
  --skill apiyi-gpt-image-2-gen

# 反转(批量/中文 prompt 友好)
npx skills add https://github.com/wuchubuzai2018/expert-skills-hub \
  --skill apiyi-gpt-image-2-all-gen

命令完成后,Skill 会被放置到 OpenClaw 的默认 Skill 目录(通常是 ~/.openclaw/skills/)。你可以用下面的命令确认:

npx skills list
# 预期输出:
# - apiyi-gpt-image-2-gen       ✓ installed
# - apiyi-gpt-image-2-all-gen   ✓ installed

2.3 Step 2:配置 API 密钥

OpenClaw 接入 gpt-image-2 只需要一个环境变量:

# macOS / Linux
export APIYI_API_KEY="sk-your-key-here"

# Windows PowerShell
$env:APIYI_API_KEY = "sk-your-key-here"

建议把这行写进 ~/.zshrc / ~/.bashrc 做持久化。

🎯 拿 Key 步骤:访问 API易 apiyi.com,注册后进入控制台 → API Keys → 新建密钥。建议开启"用量上限"功能,给 OpenClaw 用的 Key 单独设置日上限(如 ¥50),避免 Agent 误触发消耗过大。

可选的三线路切换,如果你在批量场景需要高并发:

export APIYI_BASE_URL="https://vip.apiyi.com/v1"   # VIP 线路
# 或
export APIYI_BASE_URL="https://b.apiyi.com/v1"     # 备用

不设置时默认走 https://api.apiyi.com/v1

2.4 Step 3:跑第一张图(Node.js)

Skill 安装完自带示例脚本。最简单的验证命令:

cd ~/.openclaw/skills/apiyi-gpt-image-2-gen

node scripts/generate_image.js \
  -p "A minimalist poster with the text 'HELLO 2026' centered" \
  -s "1024x1024" \
  -q "medium" \
  -o "png" \
  -f "./hello_2026.png"

大约 20–40 秒后终端会提示:

✔ Image generated: ./hello_2026.png (1024x1024, png, 312 KB)

打开 hello_2026.png,应该能看到一张干净的极简海报,中间是清晰的 "HELLO 2026" 文字。看到文字不糊就说明整条链路(OpenClaw Skill → API易 api.apiyi.com → OpenAI gpt-image-2)已经通了。

2.5 Step 4:跑第一张图(Python 版)

如果你的项目是 Python 技术栈,同一个 Skill 也带了 Python 脚本:

cd ~/.openclaw/skills/apiyi-gpt-image-2-gen

python3 scripts/generate_image.py \
  -p "A minimalist poster with the text 'HELLO 2026' centered" \
  -s "1024x1024" \
  -q "medium" \
  -o "png" \
  -f "./hello_2026.png"

参数与 Node.js 版完全一致,-p/-s/-q/-o/-f 五个短选项或对应的长选项(--prompt/--size/--quality/--output-format/--filename)。

💡 无需切换运行时:同一个 Skill 包里两个脚本并存,意味着你可以在同一个项目里一部分代码用 Node(前端友好)、一部分代码用 Python(数据科学友好),OpenClaw 接入 gpt-image-2 的 Skill 对两边都是对等公民

2.6 Step 5:在 OpenClaw 里自然语言调用

上面的 CLI 只是验证 Skill 可用。真正的用法是让 OpenClaw 自主调用。启动 OpenClaw 后,直接用自然语言下达:

用户: 帮我用 gpt-image-2 画一张 4K 的陶瓷茶杯商品图,
      早晨柔光,素色背景,PNG 格式,保存到 ./output/tea_cup.png

OpenClaw: 好的,我选用 apiyi-gpt-image-2-gen Skill 处理这个请求。
         参数: size=3840x2160, quality=high, output-format=png
         正在生成...
         ✔ 完成: ./output/tea_cup.png (3840x2160, 2.4 MB)

OpenClaw 的推理层会:

  1. 识别任务类型 = 图像生成
  2. 比较两个 Skill 的 SKILL.md,选 apiyi-gpt-image-2-gen(因为用户要 4K + PNG)
  3. 把"4K"翻译成 3840x2160,"早晨柔光"并入 prompt
  4. 执行 generate_image.js,返回文件路径

整个过程你只说了一句中文,没有任何 Python/Node 代码。这就是 OpenClaw 接入 gpt-image-2 走 Skill 路径的核心价值。


三、OpenClaw 调用 gpt-image-2 的参数速查

3.1 正转 Skill:apiyi-gpt-image-2-gen

这是精细控制型,推荐默认使用。完整参数表:

选项 长选项 值范围 默认 说明
-p --prompt 文本 必填 图像描述,建议英文+中文关键词混写
-s --size WIDTHxHEIGHT 1024x1024 任意 16 倍数,最大 3840x3840
-q --quality low/medium/high/auto auto 海报选 high,草图选 low
-o --output-format png/jpeg/webp png 透明背景必须 png
-c --output-compression 0-100 85 仅 jpeg/webp 生效
-i --input-image 路径(可重复) 最多 5 张参考图
-m --mask 路径 黑白 Mask,白=编辑区
-f --filename 路径 ./output.png 输出文件

常用 size 速查:

用途 推荐 size
微信朋友圈 1080x1080
小红书竖图 1080x1440
B 站封面 1920x1080
博客头图 1600x900
4K 海报 3840x2160
长条 banner 2400x800
手机壁纸 1170x2532

3.2 反转 Skill:apiyi-gpt-image-2-all-gen

这是经济批量型,按张计费约 $0.03。参数更精简:

选项 长选项 值范围 说明
-p --prompt 文本 描述,尺寸/比例直接写进文字
-r --response-format url / b64_json url 返回 24h CDN 链接,b64_json 返回 Base64
-i --input-image 路径(可重复) 最多 5 张参考图
-f --filename 路径 输出文件(url 模式下会自动下载)

反转 Skill 不暴露 -s/-q/-o,因为底层模型是对话式,尺寸需要通过 prompt 表达:

# 正确示范
-p "生成一张 16:9 横版壁纸,科幻城市夜景,霓虹灯光"

# 错误示范(反转模式不支持 -s)
-p "科幻城市夜景" -s "1920x1080"  # ❌

3.3 三个实战命令

实战 1:4K 电影海报(正转)

node scripts/generate_image.js \
  -p "Cinematic poster for sci-fi novel 'NEON HORIZON', \
     dark blue and magenta gradient sky, lone silhouette on cliff, \
     bold serif title centered at top, subtle tagline bottom, \
     35mm film grain" \
  -s "3840x5760" \
  -q "high" \
  -o "png" \
  -f "./poster_neon_horizon.png"
  • 2:3 竖版 4K
  • quality=high 确保文字锐利
  • 大约 3–5 分钟出图(4K 生成时间与 quality 强相关)

实战 2:Mask 局部重绘(正转 + 图+Mask)

node scripts/generate_image.js \
  -p "Replace the background with luxurious white marble countertop, \
     soft natural window light from the left, \
     keep product subject pixel-stable" \
  -i "./coffee_cup.png" \
  -m "./coffee_cup_mask.png" \
  -s "2048x2048" \
  -q "high" \
  -f "./coffee_cup_marble.png"
  • 白色像素 = 要换的背景
  • 黑色像素 = 商品本体(像素稳定)
  • gpt-image-2 不会破坏商品形状

实战 3:批量概念稿(反转 + 循环)

# 100 个服装概念,每张 $0.03,总成本约 $3
for i in $(seq 1 100); do
  node scripts/generate_image.js \
    -p "赛博朋克角色设计稿 #${i},改良汉服,霓虹色调,全身立绘" \
    -r "url" \
    -f "./concepts/concept_${i}.png"
done
  • 反转 Skill 对中文 prompt 支持更稳
  • -r url 模式下脚本会自动下载到本地
  • 批量场景建议切 APIYI_BASE_URL=https://vip.apiyi.com/v1

四、OpenClaw 接入 gpt-image-2 的进阶组合

4.1 让 Agent 自主选 Skill

同时装了正转和反转后,OpenClaw 会根据你的语言自动选。帮助 Agent 选得更准,可以在说话时带上提示词信号

你的说法 Agent 倾向选择
"高质量"、"4K"、"海报"、"商拍" 正转 apiyi-gpt-image-2-gen
"草图"、"批量"、"概念稿"、"中文" 反转 apiyi-gpt-image-2-all-gen
"先出 10 张看看" 反转(经济)
"用 Mask 改背景" 正转(反转不支持 Mask)
"固定 $0.03 一张" 反转

🎯 提示词技巧:在关键词里写"精细控制"或"经济批量"这类术语,OpenClaw 几乎 100% 命中对应 Skill。在 docs.apiyi.com 的 Skills 生态专栏里还能找到更多触发词样例。

4.2 Skill 链:生成图 → OCR → 翻译

因为 Skill 之间可以被 Agent 自由编排,OpenClaw 接入 gpt-image-2 可以串成多步流水线。示例:"生成一张带英文标语的海报,然后把标语翻译成日语版":

用户: 生成一张带 "Less is more" 英文标语的极简海报,
      然后生成同构图但标语换成日语的版本

OpenClaw:
  Step 1: apiyi-gpt-image-2-gen (英文版)
          → ./en_poster.png
  Step 2: apiyi-gpt-image-2-gen (日语版,以 en_poster.png 为参考图)
          -i ./en_poster.png
          -p "Same layout, replace text with 'より少なく、より豊かに'"
          → ./jp_poster.png

这是 Skill 生态最强大的地方:单个 Skill 做一件事,Agent 负责把它们串成任意复杂度的工作流

4.3 把 Skill 封装进 CI/CD

两个 Skill 的脚本本质是标准 CLI,意味着它们能无缝进入 CI/CD:

# .github/workflows/generate-og-image.yml
name: Generate OG image on release
on:
  release:
    types: [published]

jobs:
  og-image:
    runs-on: ubuntu-latest
    steps:
      - uses: actions/checkout@v4
      - uses: actions/setup-node@v4
        with: { node-version: '20' }
      - run: npx skills add https://github.com/wuchubuzai2018/expert-skills-hub --skill apiyi-gpt-image-2-gen
      - env:
          APIYI_API_KEY: ${{ secrets.APIYI_API_KEY }}
        run: |
          node ~/.openclaw/skills/apiyi-gpt-image-2-gen/scripts/generate_image.js \
            -p "Release ${{ github.event.release.tag_name }} cover image" \
            -s "1200x630" \
            -q "high" \
            -f "./og-image.png"
      - uses: actions/upload-artifact@v4
        with: { name: og-image, path: ./og-image.png }

每次发 release 自动生成 OG 图,Agent 和 CI 共享同一套 Skill 定义。

4.4 在 Claude Code 和 Cursor 里复用

本文虽然聚焦 OpenClaw,但 apiyi-gpt-image-2-gen / apiyi-gpt-image-2-all-gen 两个 Skill 完全遵循通用 Skills 标准,所以:

客户端 是否支持 备注
OpenClaw 本文主场景
Claude Code 放到 ~/.claude/skills/ 即可
Cursor 通过 Rules 文件引用
Windsurf Skill 规范兼容
自建 Agent(LangChain 等) ⚠️ 需要包一层 Tool Adapter

"一次安装,多客户端复用"让你的图像生成能力可以跟着主力工具迁移,不用每次重写。


五、OpenClaw 接入 gpt-image-2 常见问题 FAQ

Q1:npx skills add 报 "command not found"?

确保 OpenClaw 已升级到最新版(openclaw update),旧版没有 Skills CLI。如果仍然报错,可以手动克隆仓库到 ~/.openclaw/skills/ 目录作为兜底。

Q2:跑脚本提示 "APIYI_API_KEY is not set"?

三步排查:

  1. echo $APIYI_API_KEY 看变量是否导出成功
  2. 确认 Key 带 sk- 前缀
  3. 如果刚写入 ~/.zshrc,开个新终端让它生效

Q3:如何把调用切到 vip.apiyi.com 高并发线路?

两种方式:

# 方式 1:全局环境变量
export APIYI_BASE_URL="https://vip.apiyi.com/v1"

# 方式 2:单次调用前缀
APIYI_BASE_URL="https://vip.apiyi.com/v1" node scripts/generate_image.js ...

备用域名同理:b.apiyi.com。三个域名共用同一把 Key,主站抖动时手工切到 VIP 通常能立刻恢复,具体策略也可以参考 API易官方文档 docs.apiyi.com 的线路切换指南。

Q4:反转和正转到底怎么选?

对照这张决策表:

如果你需要…
精确控制分辨率(比如 1920x1080 正转
使用 Mask 局部重绘 正转
4K 以上高质量海报 正转
批量跑 50+ 张 反转
中文 prompt 占主导 反转
成本可预测($0.03/张) 反转

最省心的做法:两个都装,让 OpenClaw Agent 根据你的自然语言自动选。

Q5:能在 Claude Code 里用吗?

可以。把 Skill 包从 ~/.openclaw/skills/ 软链接或复制到 ~/.claude/skills/,Claude Code 会自动识别 SKILL.md 并把它注册为可调用工具。同一把 APIYI_API_KEY 共用。

Q6:Skill 安全吗?

社区 Skill 生态需要警惕。2026 年 2 月曾曝出 341 个恶意 Skill 通过 ClawHub 分发 Atomic Stealer 恶意软件。建议:

  1. 只装来自可信仓库的 Skill(本文的 wuchubuzai2018/expert-skills-hub 是 API易官方源)
  2. 安装后审阅 SKILL.md 和 scripts 内容,尤其注意 curl | bash 或连接陌生域名的代码
  3. npx skills inspect <skill-name> 查看 Skill 会访问哪些网络地址

官方 API易 Skill 的所有请求都只打向 *.apiyi.com,可以安全审计。

Q7:4K 出图很慢怎么办?

  • 正常现象。quality=high + 3840x2160 大约需要 3–5 分钟
  • 在脚本外层加超时保护(Bash 里 timeout 360 node ...
  • 如果需要快速预览,先用 size=2048x1152 quality=medium 出草图,确认效果再升 4K

Q8:如何做成本监控?

在 API易 apiyi.com 控制台开启「日预算告警」和「按 Key 统计」。给 OpenClaw 专用 Key 单独设额度,既能观察消耗,也能在意外情况下及时停损。


六、OpenClaw 接入 gpt-image-2 总结

回过头看,OpenClaw 接入 gpt-image-2 在 2026 年的最佳路径已经从"写代码"转向"装 Skill"。原因非常朴素:

  1. 更快npx skills add + export KEY 两条命令,30 秒完成
  2. 更稳:HTTP 细节、重试策略、参数校验全都封在 Skill 里,升级跟着 Skill 作者走
  3. 更广:同一个 Skill 在 OpenClaw / Claude Code / Cursor 里通用
  4. 更聪明:Agent 看得懂 SKILL.md,能自己决定什么时候用、用哪一个

API易贡献的两个 Skill apiyi-gpt-image-2-gen(精细控制)与 apiyi-gpt-image-2-all-gen(经济批量)正好覆盖了最常见的两类场景。同时安装它们就是目前最省心的起点——后续不管是 4K 海报还是 100 张概念稿,OpenClaw Agent 都能自动选对 Skill。

🎯 落地建议:先去 API易 apiyi.com 申请一把测试 Key(建议设置 ¥20–50 的日上限),按本文 §2 的 5 步跑通最小示例;确认链路通畅后,回到 §3 的实战命令尝试 4K 海报和 Mask 重绘;遇到线路抖动时随时把 APIYI_BASE_URL 切到 vip.apiyi.comb.apiyi.com。需要更复杂的 Skill 组合或 CI/CD 样例,可以查阅 API易官方文档 docs.apiyi.com 的 Skills 生态专栏。

至此,你已经拥有一套完整的、跨客户端可复用的 OpenClaw gpt-image-2 接入方案。接下来要做的唯一事情,就是把"写一个图像调用工具"这件事从你的 todo list 上永久删掉——交给 Skill 就好。


作者: API易技术团队
相关资源:

  • Skills 仓库: github.com/wuchubuzai2018/expert-skills-hub
  • OpenClaw 主页: github.com/openclaw/openclaw
  • API易官网: apiyi.com
  • API易文档: docs.apiyi.com
  • API易主站: api.apiyi.com(备用 vip.apiyi.com / b.apiyi.com)

类似文章