SWE-bench

大模型 API 新闻|更新日志|站点公告

MiniMax-M3 API 限时 5 折接入指南：100 万上下文 + SWE-Bench Pro 59.0 反超 GPT-5.5
作者APIYI - Stable and affordable AI API 2026年 6月 5日

2026 年 6 月 1 日，MiniMax 正式发布开源新旗舰 MiniMax-M3。这是业界第一个在单一模…

阅读更多 MiniMax-M3 API 限时 5 折接入指南：100 万上下文 + SWE-Bench Pro 59.0 反超 GPT-5.5
AI编程|模型选型与对比

GPT-5.5 VS Claude Opus 4.7 编程能力深度对比：SWE-bench 实测谁更强
作者APIYI - Stable and affordable AI API 2026年 4月 26日

作者注：基于 SWE-bench Pro、Terminal-Bench 2.0、LiveCodeBench 等…

阅读更多 GPT-5.5 VS Claude Opus 4.7 编程能力深度对比：SWE-bench 实测谁更强
大模型 API 新闻|更新日志|站点公告

Kimi K2.6 API 接入指南 (2026新版): 256K 上下文 / 6折调用 / SWE-Bench 反超 GPT-5.4
作者APIYI - Stable and affordable AI API 2026年 4月 25日

国产开源大模型在 2026 年迎来重要节点 —— 月之暗面 (Moonshot AI) 旗舰模型 Kimi K…

阅读更多 Kimi K2.6 API 接入指南 (2026新版): 256K 上下文 / 6折调用 / SWE-Bench 反超 GPT-5.4
Claude API|更新日志

Claude Opus 4.7 Benchmark 全解析: 7 大榜单领先 GPT-5.4 的实测数据
作者APIYI - Stable and affordable AI API 2026年 4月 19日

作者注: Claude Opus 4.7 基准测试深度解读: SWE-bench Verified 87.6%…

阅读更多 Claude Opus 4.7 Benchmark 全解析: 7 大榜单领先 GPT-5.4 的实测数据
Claude API

Claude Opus 4.7 上线首日深度评测：8项实测数据揭示与4.6的真实差距
作者APIYI - Stable and affordable AI API 2026年 4月 17日

Claude Opus 4.7 于 2026 年 4 月 16 日正式发布，上线第二天社区就出现两极分化的讨论…

阅读更多 Claude Opus 4.7 上线首日深度评测：8项实测数据揭示与4.6的真实差距
AI编程|Claude API

GLM-5.1 vs Claude Sonnet 4.6 编程对比:6 维基准实测,谁才是 2026 年最强 Coding 模型?
作者APIYI - Stable and affordable AI API 2026年 4月 10日

2026 年 4 月,中国大陆开发者群里被问得最多的两款编码模型是 GLM-5.1 和 Claude Sonn…

阅读更多 GLM-5.1 vs Claude Sonnet 4.6 编程对比:6 维基准实测,谁才是 2026 年最强 Coding 模型?
大模型 API 新闻|模型选型与对比

MiniMax-M2.5 对比 GLM-5 各擅什么：编码 vs 推理 2 大新模型 6 维度全解析
作者APIYI - Stable and affordable AI API 2026年 2月 14日

作者注：深度对比 2026 年 2 月同期发布的 MiniMax-M2.5 和 GLM-5 两大开源模型，从编…

阅读更多 MiniMax-M2.5 对比 GLM-5 各擅什么：编码 vs 推理 2 大新模型 6 维度全解析
大模型 API 新闻|模型选型与对比

MiniMax-M2.5 对比 Claude Opus 4.6 编程能力：5 项基准测试和 60 倍价格差异全解析
作者APIYI - Stable and affordable AI API 2026年 2月 13日

作者注：从 SWE-Bench、Multi-SWE-Bench、BFCL 工具调用、编码速度和价格 5 个维度…

阅读更多 MiniMax-M2.5 对比 Claude Opus 4.6 编程能力：5 项基准测试和 60 倍价格差异全解析
AI编程|大模型 API 新闻

用 MiniMax-M2.5 实现 SWE-Bench 80.2% 编码能力：2 个版本 API 接入与实战指南
作者APIYI - Stable and affordable AI API 2026年 2月 13日

作者注：深度解析 MiniMax-M2.5 和 M2.5-Lightning 两个版本的编码能力、智能体表现和…

阅读更多用 MiniMax-M2.5 实现 SWE-Bench 80.2% 编码能力：2 个版本 API 接入与实战指南
Claude Opus 4.5 vs GPT-5.1 In-Depth Comparison: Who is the Programming King of 2025
作者APIYI - Stable and affordable AI API 2025年 11月 26日

In November 2025, the AI programming assistant field we…

阅读更多 Claude Opus 4.5 vs GPT-5.1 In-Depth Comparison: Who is the Programming King of 2025