作者注:OpenAI 最新 mini 系列 gpt-5.4-mini 已上线 API,SWE-Bench Pro 54.4% 超越 GPT-5 mini 45.7%。本文完整解读其能力跃升、缓存输入 90% 折扣、与 4o-mini/5-mini 的升级取舍。
如果你还在用 gpt-4o-mini 或 gpt-5-mini,你可能已经注意到 OpenAI 在 2026-03-17 上线了一个 "我们至今最强的 mini 模型" —— gpt-5.4-mini。它在 SWE-Bench Pro 上拿到 54.4%(GPT-5 mini 仅 45.7%),Terminal-Bench 2.0 拿到 60.0%,Computer Use 任务的 OSWorld-Verified 拿到 72.1%,而响应速度比上一代 GPT-5 mini 快了一倍。
这看起来只是一次小版本更新,但它的设计意图远不止于此。OpenAI 官方明确将 gpt-5.4-mini 定位为"专为编程、Computer Use、Subagents 优化"的 mini 模型 —— 这是 mini 系列首次将 agentic 能力下放到入门价位段。本文将逐层拆解 GPT-5.4 mini 到底是什么、相比 4o-mini / 5-mini 升级在哪、以及它对你的实际工作意味着什么。
核心价值:从能力跃升、价格结构、缓存优化、与老 mini 系列的取舍四个角度,完整解读 GPT-5.4 mini 的接入方案,并给出明确的升级判断标准。

GPT-5.4 mini API 核心要点
| 要点 | 说明 | 价值 |
|---|---|---|
| 能力跃升 | SWE-Bench Pro 54.4% vs GPT-5 mini 45.7% | 编码任务正确率提升 19% |
| 400K 长上下文 | 输入 400,000 tokens + 输出 128,000 | 完整代码库 / 长文档一次性处理 |
| 缓存 90% 折扣 | 缓存输入仅 $0.075/1M | 高频上下文场景成本骤降 |
| Computer Use | OSWorld-Verified 72.1% | mini 系列首次完整支持桌面自动化 |
| Default 全开放 | API易默认分组直接可用 | 新用户即用即走,无需申请 |
GPT-5.4 mini 与上一代 mini 的核心差异
GPT-5.4 mini 不是简单的"价格下调版"。OpenAI 在三个维度做了实质性的能力升级:
第一,Subagents 编排首次进入 mini 价位段。在过去,要让 mini 模型可靠地协调多个子任务、管理工具调用链路,几乎是不可能的 —— 它们通常在 3-4 步之后就会丢失上下文或忽略指令。GPT-5.4 mini 通过强化的 Reasoning Token 机制和指令跟随训练,在多 Agent 协作场景下达到了 GPT-5.4 标准版约 90% 的可靠性,而成本仅为 1/6。
第二,Computer Use 完整支持。GPT-5.4 mini 是 OpenAI mini 系列中首个将 OSWorld-Verified 推到 70%+ 的模型。这意味着你可以用 mini 价位部署完整的桌面自动化 Agent,做点击、表单填充、文件操作等任务。
第三,响应速度 2x 提升。在保持能力跃升的同时,GPT-5.4 mini 比 GPT-5 mini 快了一倍。对于高吞吐场景(客服、批量处理)这是直接的成本节省。

GPT-5.4 mini API 快速上手
极简 Python 示例(替换老 mini 模型)
如果你之前在用 gpt-4o-mini 或 gpt-5-mini,只需修改 model 参数即可切换到 gpt-5.4-mini,其他代码完全无需改动:
import openai
client = openai.OpenAI(
api_key="YOUR_API_KEY",
base_url="https://vip.apiyi.com/v1"
)
response = client.chat.completions.create(
model="gpt-5.4-mini", # 仅这一行变化
messages=[
{"role": "user", "content": "用 Python 实现一个支持 LRU 淘汰的并发缓存"}
]
)
print(response.choices[0].message.content)
极简 cURL 示例
curl https://vip.apiyi.com/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_API_KEY" \
-d '{
"model": "gpt-5.4-mini",
"messages": [
{"role": "user", "content": "总结这份长文档的核心观点"}
]
}'
Computer Use 调用范式(mini 系列首次支持)
# 启用 Computer Use 工具
response = client.chat.completions.create(
model="gpt-5.4-mini",
messages=[{
"role": "user",
"content": "帮我打开浏览器,搜索 'OpenAI API 文档',点进第一个结果"
}],
tools=[{
"type": "computer_use",
"config": {
"screen_width": 1920,
"screen_height": 1080
}
}]
)
# 模型返回结构化的操作指令(click/type/scroll 等)
for action in response.choices[0].message.tool_calls:
print(f"动作: {action.function.name}, 参数: {action.function.arguments}")
查看完整生产环境调用代码(含缓存命中追踪、成本统计)
import openai
from typing import List, Dict
# GPT-5.4 mini 价格(每 1M tokens)
PRICE_INPUT = 0.75
PRICE_INPUT_CACHED = 0.075 # 缓存命中价(90% 折扣)
PRICE_OUTPUT = 4.50
def call_gpt54_mini(
messages: List[Dict],
api_key: str,
max_tokens: int = 4096
) -> Dict:
"""
生产级 GPT-5.4 mini 调用,带缓存命中率追踪
"""
client = openai.OpenAI(
api_key=api_key,
base_url="https://vip.apiyi.com/v1"
)
try:
response = client.chat.completions.create(
model="gpt-5.4-mini",
messages=messages,
max_tokens=max_tokens
)
usage = response.usage
input_tokens = usage.prompt_tokens
output_tokens = usage.completion_tokens
# 缓存命中 tokens(取决于 SDK 版本)
cached_tokens = getattr(usage, 'prompt_tokens_details', {}).get('cached_tokens', 0)
regular_input = input_tokens - cached_tokens
# 分段计费
input_cost = (
regular_input / 1_000_000 * PRICE_INPUT +
cached_tokens / 1_000_000 * PRICE_INPUT_CACHED
)
output_cost = output_tokens / 1_000_000 * PRICE_OUTPUT
total_cost = input_cost + output_cost
cache_rate = cached_tokens / max(input_tokens, 1) * 100
print(f"📊 输入: {input_tokens:,} | 缓存命中: {cached_tokens:,} ({cache_rate:.1f}%)")
print(f"📊 输出: {output_tokens:,} tokens")
print(f"💰 本次成本: ${total_cost:.4f}")
print(f"💰 缓存节省: ${(cached_tokens / 1_000_000 * (PRICE_INPUT - PRICE_INPUT_CACHED)):.4f}")
return {
"content": response.choices[0].message.content,
"tokens": {
"input": input_tokens,
"cached": cached_tokens,
"output": output_tokens
},
"cost_usd": total_cost,
"cache_hit_rate": cache_rate
}
except openai.RateLimitError:
return {"error": "速率限制,稍后重试"}
except openai.APIError as e:
return {"error": f"API 错误: {str(e)}"}
# 使用示例
result = call_gpt54_mini(
messages=[
{"role": "system", "content": "你是资深 Python 工程师"},
{"role": "user", "content": "帮我审阅这段代码的并发安全问题..."}
],
api_key="YOUR_API_KEY"
)
print(result["content"])
🎯 快速上手建议:GPT-5.4 mini 在 API易 已对 Default 默认分组完全开放,新用户无需申请即可直接调用。建议通过 API易 apiyi.com 平台接入,充值 100 美金赠送 10%,等效官网 85 折左右,且国内直连无需翻墙,完全兼容 OpenAI SDK。
GPT-5.4 mini API 价格详解
官方价格结构
GPT-5.4 mini 的定价相对老 mini 系列有所上调,但通过缓存机制可以显著降低实际成本:
| 计费类型 | 价格(每 1M tokens) | 说明 |
|---|---|---|
| 输入 | $0.75 | 标准定价 |
| 缓存输入 | $0.075 | 90% 折扣,大幅降本 |
| 输出 | $4.50 | 包含 reasoning tokens |
| Batch API 输入 | $0.75 | 与标准价相同 |
| 区域数据驻留端点 | +10% | 数据合规场景 |
三代 mini 系列价格对比
| 模型 | 输入价格 | 缓存输入 | 输出价格 | 上下文 | 最大输出 |
|---|---|---|---|---|---|
| GPT-4o mini | $0.15 | 不支持 | $0.60 | 128K | 16K |
| GPT-5 mini | $0.25 | $0.025 | $2.00 | 400K | 128K |
| GPT-5.4 mini | $0.75 | $0.075 | $4.50 | 400K | 128K |
⚠️ 重要观察:GPT-5.4 mini 的标准价格是 GPT-4o mini 的 5 倍、GPT-5 mini 的 3 倍。但请关注两个关键事实:1)启用缓存后单次成本可降至 $0.0075/1M(部分高频场景),2)能力跃升让单次任务往往无需多轮调试,综合调用次数减少。
缓存命中场景成本测算
GPT-5.4 mini 的 90% 缓存折扣是这次升级最被低估的特性:
| 场景 | 输入 tokens | 缓存命中率 | 实际单次成本 |
|---|---|---|---|
| 高频客服(系统 prompt 复用) | 5K | 80% | $0.0046 |
| 代码助手(上下文复用) | 50K | 70% | $0.034 |
| 长文档问答(文档复用) | 200K | 90% | $0.030 |
| Subagent 编排(共享指令) | 30K | 85% | $0.0162 |
💰 缓存优化建议:GPT-5.4 mini 的缓存机制对长 system prompt + 重复上下文的场景效果最佳。对于客服、代码助手、长文档问答等高频场景,实际成本可能比 GPT-5 mini 还低。可通过 API易 apiyi.com 的充值赠 10% 优惠进一步降低账单。
GPT-5.4 mini API 能力跃升
Benchmark 实测对比
| 评测维度 | GPT-4o mini | GPT-5 mini | GPT-5.4 mini | 提升幅度 |
|---|---|---|---|---|
| SWE-Bench Pro(编码) | ~23% | 45.7% | 54.4% | +8.7pp |
| Terminal-Bench 2.0 | ~30% | ~50% | 60.0% | +10pp |
| OSWorld-Verified(Computer Use) | 不支持 | ~58% | 72.1% | +14pp |
| 响应速度 | 基准 | 基准 | 2x 提升 | 翻倍 |
能力升级解读
SWE-Bench Pro 54.4%:这是 GPT-5.4 mini 最值得关注的数据。54.4% 已经接近 GPT-5.4 标准版的 57.7%,但价格只有标准版的 1/6。对于真实 GitHub Issue 修复、代码库重构等任务,mini 现在已经是可靠选择。
Terminal-Bench 60.0%:意味着 mini 模型在终端命令执行、调试、自动化工作流中能稳定完成 60% 以上的任务。结合 Subagents 编排,可以构建可靠的 CI/CD 自动化、代码审查 Bot 等应用。
OSWorld 72.1%:这是 mini 系列在 Computer Use 任务上的历史性突破。可以用 mini 价位部署桌面自动化 Agent,处理表单、点击、文件操作。

GPT-5.4 mini vs 同档模型对比
| 模型 | 输入 / 输出 | 上下文 | 编码能力 | Computer Use | 推荐场景 |
|---|---|---|---|---|---|
| GPT-4o mini | $0.15 / $0.60 | 128K | 弱 | 不支持 | 已过时,极简任务 |
| GPT-5 mini | $0.25 / $2.00 | 400K | 中等 | 部分支持 | 通用客服、轻量任务 |
| GPT-5.4 mini | $0.75 / $4.50 | 400K | 强 | 完整支持 | Agent / Computer Use / 长上下文 |
| GPT-5.4 标准版 | $5.00 / $30.00 | 1M | 顶级 | 顶级 | 复杂推理、关键决策 |
| Claude Haiku 4.5 | $0.80 / $4.00 | 200K | 强 | 不支持 | 文笔强 / 写作 |
升级决策建议
4o-mini → 5.4-mini 对标:GPT-4o mini 在简单文本任务上仍有价格优势。但其能力已经显著落后,只要你的应用涉及推理、编码、长上下文,升级到 5.4-mini 都是值得的。即使按 5 倍单价计算,综合调用次数和质量提升也通常更划算。
5-mini → 5.4-mini 对标:GPT-5 mini 在通用客服、翻译等任务上仍能胜任。但如果你需要 Computer Use、Subagents 编排、复杂 Agent 工作流,5.4-mini 是必选。同时缓存折扣也从 90% 提升到 90% 但绝对值更高,长期看更划算。
5.4-mini → 5.4 标准版对标:GPT-5.4 mini 在 80% 的常规任务上能力相近,价格只有 1/6。只有当任务确实涉及顶级推理(数学证明、20 小时复杂 Agent)时,才需要切到标准版。
📊 升级路径建议:可通过 API易 apiyi.com 在同一 API Key 下无缝对比 4o-mini / 5-mini / 5.4-mini / 5.4 标准版的实际效果,只需修改 model 参数。这种统一接入方式特别适合需要逐步迁移、AB 测试的团队。
GPT-5.4 mini API 适用场景
GPT-5.4 mini 的"高能力 + 缓存优化 + Computer Use + Subagents"组合特别适合以下场景:
- 高吞吐对话客服:缓存命中率高、响应速度快、推理深度足够处理复杂问题
- 大规模内容生成:批量摘要、翻译、改写,400K 上下文一次性处理整本文档
- Subagents 多 Agent 协作:首次在 mini 价位段实现可靠的子任务编排
- 桌面自动化 Agent:OSWorld 72.1% 让浏览器、表单、文件操作成为可能
- 轻量代码补全与审查:SWE-Bench Pro 54.4% 接近标准版,适合 IDE 集成
- 文档批量处理:配合 Batch API 和缓存,处理万级文档极具成本优势
- 教育辅导工具:推理 Token 增强带来更可靠的解题、答疑能力
🎯 场景决策:如果你的应用每天调用次数 > 10K,缓存命中率 > 50%,且需要推理或工具能力 —— GPT-5.4 mini 是 2026 年最值得切换的 mini 模型。可通过 API易 apiyi.com 直接接入,Default 分组无需任何申请。
GPT-5.4 mini 在 API易 的接入说明
Default 分组开放策略
API易平台对 GPT-5.4 mini 采用与 Grok 4.3 一致、与 GPT-5.5 Pro 不同的开放策略:
- ✅ Default 默认分组:全开放,新用户注册即可调用
- ✅ SVIP 高级分组:全开放,无任何限制
- ✅ 缓存折扣同步:$0.075/1M 缓存价格完全适用
为什么 GPT-5.4 mini 全分组开放,而 GPT-5.5 Pro 仅 SVIP?核心还是基于单次调用风险评估:
- GPT-5.4 mini:单次调用通常几分钱,全分组开放无风险
- GPT-5.5 Pro:单次调用可能几美金,需 SVIP 分组保护避免新手误用
这种按风险分级管理的设计让 mini 系列对所有开发者保持低门槛,而高价值模型则提供分组保护。
API易 vs 官网成本对比
| 项目 | OpenAI 官网 | API易 apiyi.com |
|---|---|---|
| 基础价格 | $0.75 / $4.50 per 1M | $0.75 / $4.50 per 1M(同价) |
| 缓存折扣 | $0.075 / 1M(90%) | $0.075 / 1M(完全同步) |
| 充值优惠 | 无 | 充值 $100 送 $10(10%) |
| 实际成本 | 100% 标准价 | 约 90% 标准价(85 折左右) |
| 国内访问 | 需翻墙 | 直连,无需翻墙 |
| 支付方式 | 国际信用卡 | 支持人民币、支付宝、微信 |
| SDK 兼容 | OpenAI 原生 | 完全兼容 OpenAI SDK |
| 分组限制 | 无 | Default + SVIP 全开放 |
💰 成本优化:GPT-5.4 mini 通过 API易 apiyi.com 接入,充值 100 美金送 10% 等效官网 85 折,且缓存折扣完全同步。对于每月调用量大、缓存命中率高的应用,综合成本可比 OpenAI 官网低 20% 以上。
常见问题 FAQ
Q1: 什么是 GPT-5.4 mini?它和 GPT-5 mini、GPT-4o mini 有什么核心区别?
GPT-5.4 mini 是 OpenAI 在 2026-03-17 上线的新一代 mini 模型,定位"我们至今最强的 mini 模型"。核心区别:1)SWE-Bench Pro 54.4% 显著领先 GPT-5 mini 45.7%、4o-mini 23%;2)首次完整支持 Computer Use(OSWorld 72.1%);3)Subagents 编排能力进入 mini 价位;4)响应速度比 5 mini 快 2x。但价格也上涨至 $0.75/$4.50,通过缓存可以抵消部分成本。
Q2: 我现在用的是 gpt-4o-mini / gpt-5-mini,值得升级到 5.4-mini 吗?
4o-mini 用户强烈建议升级:能力差距已经过大,即使按 5 倍单价计算,综合质量和减少的多轮调试通常更划算。
5-mini 用户视场景而定:
- ✅ 建议升级:涉及 Computer Use、Subagents、复杂工具链、长上下文(>200K)的应用
- ⏸️ 可继续用:简单客服 FAQ、轻量翻译、纯文本生成等 5-mini 已经够用的场景
最佳实践:在 API易 apiyi.com 用同一 API Key 跑 AB 测试,实测哪个更划算。
Q3: GPT-5.4 mini 的缓存折扣 $0.075/1M 怎么启用?
OpenAI 的缓存机制是自动触发的,无需额外参数。当你发送的 prompt 前缀(通常是 system prompt + 共享上下文)与最近 5-10 分钟内的请求一致时,会自动命中缓存,享受 90% 折扣($0.075/1M)。
优化建议:
- 把 system prompt 放在 messages 数组最前面
- 共享上下文(如知识库、文档摘要)放在 system prompt 之后
- 用户实际查询放在最后
- 保持高频调用(>5 分钟一次会过期)
通过 API易 apiyi.com 平台调用时,缓存折扣完全同步官网,无需额外配置。
Q4: 何时该用 GPT-5.4 mini,何时该用 GPT-5.4 标准版?
优先选 mini 的场景:
- 高吞吐(>10K 次/天)
- 缓存命中率 > 50%
- SWE-Bench / Terminal-Bench 类任务
- Computer Use 自动化
- 成本敏感的生产环境
优先选标准版的场景:
- FrontierMath 级数学证明
- 20 小时级复杂 Agent
- 法律合同精读、医学诊断等高风险任务
- 单次调用价值 > $0.10 的关键决策
简单原则:80% 任务用 mini 已经足够,只有极复杂推理才升级标准版。
Q5: 如何通过 API易 调用 GPT-5.4 mini?需要修改哪些代码?
API易完全兼容 OpenAI SDK,只需三步:
- 访问 API易 apiyi.com 注册账号(无需申请,Default 分组直接可用)
- 获取 API Key
- 修改代码 base_url 为
https://vip.apiyi.com/v1,model 设为gpt-5.4-mini
client = openai.OpenAI(
api_key="YOUR_KEY",
base_url="https://vip.apiyi.com/v1"
)
response = client.chat.completions.create(
model="gpt-5.4-mini",
messages=[...]
)
充值 100 美金赠送 10%,等效官网 85 折左右,缓存折扣完全同步。
Q6: GPT-5.4 mini 支持微调(Fine-tuning)吗?
不支持。这是 GPT-5.4 mini 当前的主要限制之一。如果你的应用必须使用 fine-tuning,需要选择:
- GPT-5 mini(支持微调,能力略逊)
- GPT-4o mini(支持微调,能力更弱)
- GPT-5.4 标准版(支持微调,价格 6 倍)
替代方案:GPT-5.4 mini 的 Reasoning Token + Function Calling + 缓存机制,通常能在不微调的情况下达到不错的效果。
Q7: GPT-5.4 mini 的 Computer Use 怎么调用?
通过 tools 参数启用:
response = client.chat.completions.create(
model="gpt-5.4-mini",
messages=[{"role": "user", "content": "帮我打开网页搜索..."}],
tools=[{
"type": "computer_use",
"config": {"screen_width": 1920, "screen_height": 1080}
}]
)
模型会返回结构化的操作指令(click/type/scroll/screenshot),你需要在客户端实现这些动作并把结果反馈给模型继续推理。OSWorld-Verified 72.1% 的得分意味着大部分桌面任务都能完成。
Q8: GPT-5.4 mini 有哪些已知限制?
主要限制包括:
- 不支持 Fine-tuning:无法用自定义数据集微调
- 不支持图像输出:仅文本输出,无法生成图像
- 价格高于老 mini:标准价是 4o-mini 的 5 倍,需配合缓存优化
- Reasoning Token 计入输出计费:复杂任务输出成本可能超预期
- 区域数据驻留 +10%:合规场景有额外费用
对实时性极敏感的场景(<1 秒响应),建议测试后再决定是否切换。
GPT-5.4 mini API 核心要点 Key Takeaways
- 能力跃升:SWE-Bench Pro 54.4% 超 GPT-5 mini 45.7% 整整 8.7 个百分点
- 缓存折扣:输入缓存 $0.075/1M 的 90% 折扣,高频场景成本骤降
- Computer Use:OSWorld 72.1%,mini 系列首次完整支持桌面自动化
- Subagents 友好:首次将多 Agent 协作下放到 mini 价位段
- 400K 长上下文:整本技术书、完整代码库一次性处理
- 响应速度 2x:在保持能力跃升的同时速度翻倍
- Default 全开放:API易 默认分组直接可用,无需任何申请
总结
GPT-5.4 mini API 的核心要点:
- 升级动机:SWE-Bench Pro / Terminal-Bench / OSWorld 三大维度全面跃升,Computer Use + Subagents 首次进入 mini 价位
- 价格定位:$0.75 / $4.50 per 1M,缓存输入 $0.075 享 90% 折扣,高频场景实际成本可能低于老 mini
- 接入方式:通过 API易 apiyi.com Default 分组直接调用,充值 100 送 10,国内直连无需翻墙
GPT-5.4 mini 不是简单的"GPT-5 mini 加价版",而是 OpenAI 把 agentic 能力下放到入门价位段的关键一步。对于每天调用 > 10K 次、缓存命中率 > 50%、需要 Agent 或 Computer Use 能力的应用,这次升级基本是必选。对于纯简单文本任务,GPT-4o mini / GPT-5 mini 仍可继续使用。
推荐通过 API易 apiyi.com 平台快速接入 GPT-5.4 mini,Default 分组无需申请、缓存折扣完全同步、充值赠送 10%、国内直连稳定。
延伸阅读 Related Articles
如果你对 GPT-5.4 mini API 感兴趣,推荐继续阅读:
- 📘 GPT-5.5 Pro API 接入指南 – 了解 OpenAI 顶级推理旗舰,与 mini 形成场景互补
- 📊 OpenAI 缓存机制深度解析:90% 折扣的最佳实践 – 掌握缓存优化的工程技巧
- 🚀 基于 GPT-5.4 mini 构建 Computer Use 自动化 Agent 实战 – 探索桌面自动化的生产级应用
📚 参考资料
-
OpenAI 官方 GPT-5.4 mini 模型文档:模型规格、定价、调用示例
- 链接:
developers.openai.com/api/docs/models/gpt-5.4-mini - 说明:获取最新最权威的官方技术参数
- 链接:
-
DataCamp GPT-5.4 mini 评测:Benchmark 详细分项与跨代对比
- 链接:
datacamp.com/blog/gpt-5-4-mini-nano - 说明:第三方独立评测,适合横向对比同类模型
- 链接:
-
API易 GPT-5.4 mini 接入文档:国内调用方案、分组说明、充值优惠
- 链接:
docs.apiyi.com - 说明:适合国内开发者的接入实操指南
- 链接:
-
OpenAI Pricing Page:完整价格表与缓存机制说明
- 链接:
developers.openai.com/api/docs/pricing - 说明:所有模型最新计费标准
- 链接:
作者:APIYI 技术团队
技术交流:欢迎在评论区讨论 GPT-5.4 mini 的升级体验,更多模型接入资料可访问 API易 docs.apiyi.com 文档中心
