好消息——Gemini 3.1 Pro Preview 已在 API易上线,现在就可以通过 API 调用。模型名称 gemini-3.1-pro-preview,提示价格 $2.00/1M tokens,补全价格 $12.00/1M tokens,与 Gemini 3.0 Pro Preview 价格完全一致。
但能力完全不在一个量级: Gemini 3.1 Pro 在 ARC-AGI-2 推理基准上达到 77.1%,是 3.0 Pro 的 2 倍以上; SWE-Bench Verified 编码评分 80.6%,首次超越 Claude Opus 4.6 的 80.9% 形成正面竞争; 输出效率提升 15%,用更少的 token 得到更可靠的结果。
核心价值: 本文将详解 Gemini 3.1 Pro Preview 的 6 大核心升级、API 调用方法、与竞品的详细对比,以及在不同场景下的最佳实践。

Gemini 3.1 Pro Preview 核心参数一览
| 参数项 | 详情 |
|---|---|
| 模型名称 | gemini-3.1-pro-preview |
| 发布日期 | 2026 年 2 月 19 日 |
| 提示价格 (≤200K tokens) | $2.00 / 百万 tokens |
| 补全价格 (≤200K tokens) | $12.00 / 百万 tokens |
| 提示价格 (>200K tokens) | $4.00 / 百万 tokens |
| 补全价格 (>200K tokens) | $18.00 / 百万 tokens |
| 上下文窗口 | 1,000,000 tokens (1M) |
| 最大输出 | 65,000 tokens (65K) |
| 文件上传上限 | 100MB (原 20MB) |
| 知识截止日期 | 2025 年 1 月 |
| API易可用状态 | ✅ 已上线 |
🚀 即刻体验: Gemini 3.1 Pro Preview 已在 API易 apiyi.com 上线,通过 OpenAI 兼容格式即可调用,无需注册谷歌账号,5 分钟完成集成。
Gemini 3.1 Pro Preview 的 6 大核心升级
升级 1: 推理性能翻倍——ARC-AGI-2 达到 77.1%
这是最引人注目的升级。在 ARC-AGI-2 基准测试中(评估模型解决全新逻辑模式的能力),Gemini 3.1 Pro 达到 77.1%,是 Gemini 3.0 Pro 的 2 倍以上。
同时,在 MCP Atlas 基准(衡量使用 Model Context Protocol 的多步骤工作流能力)上,3.1 Pro 达到 69.2%,比 3.0 Pro 的 54.1% 提升了 15 个百分点。
这意味着在复杂推理、多步逻辑链条、Agent 工作流等场景中,Gemini 3.1 Pro 有了质的飞跃。
升级 2: 三级思考深度系统——Deep Think Mini
Gemini 3.1 Pro 引入了全新的三级思考深度系统,开发者可以根据任务复杂度灵活调节「推理预算」:
| 思考级别 | 行为特征 | 适用场景 | 延迟影响 |
|---|---|---|---|
| high | 类似 Gemini Deep Think 的迷你版,深度推理 | 数学证明、复杂调试、策略规划 | 较高 |
| medium | 相当于 3.0 Pro 的 high 级别 | 代码审查、技术分析、架构设计 | 适中 |
| low | 快速响应,最小推理开销 | 数据提取、格式转换、简单问答 | 最低 |
关键点: 3.1 Pro 的 high 级别重新定义了含义——它现在是 Gemini Deep Think 的「迷你版」,推理深度远超 3.0 Pro 的 high。而 3.1 的 medium 大致等于 3.0 的 high,这意味着即使用 medium 也能获得原来最高级别的推理质量。
升级 3: 编码能力跻身顶尖——SWE-Bench 80.6%
Gemini 3.1 Pro 在编码领域的表现堪称飞跃:
| 编码基准 | Gemini 3.0 Pro | Gemini 3.1 Pro | 提升幅度 |
|---|---|---|---|
| SWE-Bench Verified | 76.8% | 80.6% | +3.8% |
| Terminal-Bench 2.0 | 56.9% | 68.5% | +11.6% |
| LiveCodeBench Pro | — | Elo 2887 | 新基准 |
SWE-Bench Verified 80.6% 的成绩意味着 Gemini 3.1 Pro 在软件工程任务上已经与 Claude Opus 4.6 (80.9%) 几乎持平,差距仅 0.3 个百分点。
Terminal-Bench 2.0 评估的是 Agent 终端编码能力——从 56.9% 到 68.5% 的提升,说明 3.1 Pro 在 Agentic 场景中的可靠性大幅增强。
升级 4: 输出能力和效率全面提升
| 能力项 | Gemini 3.0 Pro | Gemini 3.1 Pro | 改进 |
|---|---|---|---|
| 最大输出 tokens | 不详 | 65,000 (65K) | 大幅提升 |
| 文件上传上限 | 20MB | 100MB | 5 倍 |
| YouTube URL 支持 | ❌ | ✅ | 新增 |
| 输出效率 | 基准 | +15% | 更少 token 更可靠结果 |
65K 的输出上限意味着模型可以一次性生成完整的长文档、大段代码或详细的分析报告,无需多次请求拼接。
文件上传从 20MB 扩展到 100MB,结合 1M token 上下文,可以直接分析大型代码仓库、长视频或大量文档。
YouTube URL 直接传入是一个实用的新功能——开发者可以在 prompt 中直接传入 YouTube 链接,模型会自动分析视频内容,无需手动下载上传。
升级 5: customtools 专用端点——Agent 开发利器
谷歌还同步推出了 gemini-3.1-pro-preview-customtools 专用端点,这是一个针对 Agent 开发场景深度优化的版本:
- 工具调用优先级优化: 专门调优了
view_file、search_code等开发者常用工具的调用优先级 - Bash + 自定义函数混合: 特别适合需要在 bash 命令和自定义函数之间切换的 Agent 工作流
- Agentic 场景稳定性: 在多步骤 Agent 任务中的可靠性高于通用版本
这意味着如果你正在构建 AI 编程助手、代码审查 Bot、自动化运维 Agent 等工具,customtools 端点是更好的选择。
升级 6: 网络搜索能力飞跃——BrowseComp 85.9%
BrowseComp 基准测试评估模型的 Agent 网络搜索能力,Gemini 3.1 Pro 达到 85.9%,而 3.0 Pro 仅为 59.2%——提升幅度达 26.7 个百分点。
这项能力对于需要实时信息检索的应用(如研究助手、竞品分析、新闻摘要)有重大意义。
💡 技术洞察: Gemini 3.1 Pro 还推出了专门的
gemini-3.1-pro-preview-customtools端点,专为混合 bash 命令和自定义函数的开发者优化,特别调优了view_file、search_code等工具的优先级。通过 API易 apiyi.com 可以直接调用此专用端点。
Gemini 3.1 Pro Preview API 调用实战
极简调用示例 (Python)
import openai
client = openai.OpenAI(
api_key="YOUR_API_KEY",
base_url="https://api.apiyi.com/v1" # API易统一接口
)
response = client.chat.completions.create(
model="gemini-3.1-pro-preview",
messages=[
{"role": "user", "content": "分析这段代码的时间复杂度并给出优化建议:\n\ndef two_sum(nums, target):\n for i in range(len(nums)):\n for j in range(i+1, len(nums)):\n if nums[i] + nums[j] == target:\n return [i, j]"}
]
)
print(response.choices[0].message.content)
查看完整调用示例 (含思考深度控制和多模态)
import openai
import base64
client = openai.OpenAI(
api_key="YOUR_API_KEY",
base_url="https://api.apiyi.com/v1" # API易统一接口
)
# 示例 1: 高推理深度 - 复杂数学推理
response_math = client.chat.completions.create(
model="gemini-3.1-pro-preview",
messages=[{
"role": "user",
"content": "证明: 对于所有正整数 n, n^3 - n 必然能被 6 整除。请给出严格的数学证明。"
}],
temperature=0.2,
max_tokens=4096
)
# 示例 2: 多模态分析 - 图片理解
with open("architecture.png", "rb") as f:
img_data = base64.b64encode(f.read()).decode()
response_vision = client.chat.completions.create(
model="gemini-3.1-pro-preview",
messages=[{
"role": "user",
"content": [
{"type": "text", "text": "详细分析这张系统架构图,指出潜在的性能瓶颈和改进建议"},
{"type": "image_url", "image_url": {"url": f"data:image/png;base64,{img_data}"}}
]
}],
max_tokens=8192
)
# 示例 3: 长上下文代码分析
with open("large_codebase.txt", "r") as f:
code_content = f.read() # 可达数十万 tokens
response_code = client.chat.completions.create(
model="gemini-3.1-pro-preview",
messages=[
{"role": "system", "content": "你是一位资深软件架构师,请仔细分析整个代码仓库。"},
{"role": "user", "content": f"以下是完整代码仓库:\n\n{code_content}\n\n请分析:\n1. 整体架构设计\n2. 潜在的 bug\n3. 性能优化建议\n4. 代码重构方案"}
],
max_tokens=16384 # 利用 65K 输出能力
)
print(f"数学推理: {response_math.choices[0].message.content[:200]}...")
print(f"视觉分析: {response_vision.choices[0].message.content[:200]}...")
print(f"代码分析: {response_code.choices[0].message.content[:200]}...")
🎯 接入提示: 通过 API易 apiyi.com 调用 Gemini 3.1 Pro Preview,使用标准 OpenAI SDK 即可,无需安装额外依赖。已有 OpenAI 格式项目只需修改
base_url和model参数即可切换。
Gemini 3.1 Pro Preview 与竞品详细对比

关键基准综合对比表
| 基准测试 | Gemini 3.1 Pro | Claude Opus 4.6 | Claude Sonnet 4.6 | 胜出 |
|---|---|---|---|---|
| SWE-Bench Verified | 80.6% | 80.9% | 79.6% | Claude Opus (微弱) |
| ARC-AGI-2 | 77.1% | ~65% | — | Gemini 3.1 Pro |
| Terminal-Bench 2.0 | 68.5% | — | — | Gemini 3.1 Pro |
| BrowseComp | 85.9% | ~71% | — | Gemini 3.1 Pro |
| MCP Atlas | 69.2% | — | — | Gemini 3.1 Pro |
| 上下文窗口 | 1M tokens | 200K | 200K | Gemini 3.1 Pro |
| 最大输出 | 65K | — | — | Gemini 3.1 Pro |
| Input 价格 | $2.00 | $15.00 | $3.00 | Gemini 3.1 Pro |
| 可用平台 | API易 apiyi.com 等 | API易 apiyi.com 等 | API易 apiyi.com 等 | — |
各模型适用场景建议
| 使用场景 | 推荐模型 | 核心原因 |
|---|---|---|
| 复杂推理与数学 | Gemini 3.1 Pro Preview | ARC-AGI-2 77.1%,推理翻倍 |
| 超长文档/代码仓库分析 | Gemini 3.1 Pro Preview | 1M token 上下文,独此一家 |
| Agentic 编程 | Claude Opus 4.6 / Gemini 3.1 Pro | SWE-Bench 几乎持平 |
| Agent 搜索工作流 | Gemini 3.1 Pro Preview | BrowseComp 85.9% 大幅领先 |
| 中等复杂度日常编码 | Claude Sonnet 4.6 | 性价比高,79.6% 编码 |
| 预算优先的旗舰需求 | Gemini 3.1 Pro Preview | $2/$12,旗舰最低价 |
| 视频/音频多模态分析 | Gemini 3.1 Pro Preview | 原生多模态,YouTube URL 支持 |
💰 成本对比: 同等旗舰级能力,Gemini 3.1 Pro 的 Input 价格 ($2.00) 仅为 Claude Opus 4.6 ($15.00) 的 13%。对于推理和多模态场景,性价比优势极为明显。通过 API易 apiyi.com 平台可以用同一个接口快速切换测试。
Gemini 3.1 Pro Preview 最佳实践
善用三级思考深度
# 复杂推理用 high (Deep Think Mini 模式)
# 日常任务用 medium (等价于旧版 high)
# 简单任务用 low (最快响应)
# 在 API易 调用时,通过 extra_body 传递思考级别
response = client.chat.completions.create(
model="gemini-3.1-pro-preview",
messages=[{"role": "user", "content": "你的问题"}],
extra_body={"thinking_level": "high"} # high/medium/low
)
充分利用 1M Token 上下文窗口
Gemini 3.1 Pro Preview 的 1M token 上下文窗口是当前所有旗舰模型中最大的。以下是几个高价值使用场景:
代码仓库全局分析: 将数十个文件一次性传入,让模型理解完整架构后给出重构建议。这比逐文件分析更能发现跨模块的耦合问题和全局优化机会。
长文档深度理解: 法律合同、技术规格书、学术论文集——1M token 可以装下一本完整的书。结合 3.1 Pro 增强的推理深度,长文档中的隐含关联也能被识别出来。
YouTube 视频分析 (新功能): 直接在 prompt 中传入 YouTube URL,无需下载和上传视频文件。模型会自动分析视频内容,适合内容审核、竞品分析、教程总结等场景。
多轮对话长期记忆: 1M token 窗口意味着模型可以「记住」极长的对话历史,在需要大量上下文的客服、咨询、教学场景中优势明显。
注意 200K 价格阈值: 当输入超过 200K tokens 时,价格从 $2/$12 翻倍到 $4/$18。建议在使用长上下文时先评估实际 token 数,对于 200K-300K 之间的场景,考虑精简输入以控制在 200K 以内可以节省一半成本。
customtools 端点的使用方式
如果你在构建 Agent 应用,gemini-3.1-pro-preview-customtools 端点值得优先考虑:
# Agent 开发专用端点
response = client.chat.completions.create(
model="gemini-3.1-pro-preview-customtools", # Agent 优化版本
messages=[{"role": "user", "content": "查找项目中所有未处理的异常并给出修复建议"}],
tools=[
{"type": "function", "function": {"name": "search_code", "description": "搜索代码"}},
{"type": "function", "function": {"name": "view_file", "description": "查看文件"}},
]
)
该端点在工具调用的准确性和可靠性上优于通用版本,特别适合 bash 命令与自定义函数混合使用的场景。
成本优化策略
| 策略 | 方法 | 预期节省 |
|---|---|---|
| 思考级别按需切换 | 简单任务用 low,复杂任务才用 high | 30-50% |
| 利用长上下文减少请求 | 将多个相关问题合并为一次请求 | 20-40% |
| >200K token 场景注意 | 超过 200K 时价格翻倍,控制输入长度 | 避免 2x 溢价 |
| 输出 token 控制 | 设置合理的 max_tokens 避免冗余输出 | 10-20% |
| 选择合适的 Gemini 模型 | 简单任务用 Flash,复杂任务才用 3.1 Pro | 60-80% |
从 Gemini 3.0 Pro 迁移到 3.1 Pro 的步骤
迁移过程极其简单,以下是完整步骤:
第一步: 修改 model 参数
# 旧版
model="gemini-3-pro-preview"
# 新版
model="gemini-3.1-pro-preview"
第二步: 测试核心功能——在你的主要使用场景中跑几个典型 case,确认输出质量符合预期。
第三步: 探索新能力——尝试 high 思考级别的深度推理、100MB 文件上传、YouTube URL 分析等 3.1 新增功能。
第四步: 优化成本——根据不同任务设置合适的思考级别,用 medium 替代 high 处理日常任务,可以在保持质量的同时降低延迟和 token 消耗。
🎯 迁移建议: 在 API易 apiyi.com 平台上,迁移只需修改一个参数。建议先保留旧模型调用作为 fallback,确认 3.1 稳定后再全量切换。

常见问题
Q1: Gemini 3.1 Pro Preview 在 API易 上的调用方式和之前的 Gemini 模型一样吗?
完全一样。在 API易 apiyi.com 平台上,Gemini 3.1 Pro Preview 使用标准 OpenAI 兼容格式,model 参数填写 gemini-3.1-pro-preview 即可。如果你已经在用 Gemini 3.0 Pro,只需修改 model 名称,其他代码无需任何改动。
Q2: 3.1 Pro 和 3.0 Pro 价格一样,有必要切换吗?
强烈建议切换。价格完全相同 ($2/$12),但推理能力翻倍、编码从 76.8% 提升到 80.6%、输出效率提升 15%。这是纯粹的免费升级,没有不切换的理由。通过 API易 apiyi.com 只需改一个参数即可完成切换。
Q3: 三级思考深度怎么选? 会影响价格吗?
思考深度主要影响延迟和 token 消耗。high 级别推理更深但消耗更多输出 token 和时间,low 级别最快但推理浅。建议日常用 medium (等价于旧版 high 的质量),只在复杂推理场景使用 high。价格按实际 token 消耗计费,思考级别本身不额外收费。
Q4: Gemini 3.1 Pro Preview 和 Claude Opus 4.6 该选哪个?
看场景和预算:如果你需要超长上下文 (1M vs 200K)、多模态分析 (视频/YouTube)、或对价格敏感 ($2 vs $15),选 Gemini 3.1 Pro;如果你追求极致编码 (80.9% vs 80.6%) 和成熟的 Agent 生态,选 Claude Opus 4.6。两者在 API易 apiyi.com 都可以用同一个接口调用,方便 A/B 测试。
Gemini 3 系列模型全景选择指南
Gemini 3 系列目前已有多个可用模型,不同场景应选择不同版本:
| 模型 | 定位 | 核心优势 | 适用场景 | API易价格 |
|---|---|---|---|---|
| gemini-3.1-pro-preview | 旗舰推理 (NEW) | 推理翻倍,编码顶尖 | 复杂推理、代码生成、Agent | $2/$12 |
| gemini-3-pro-preview | 旗舰通用 | Agentic 编程、多模态 | 通用任务 (建议升级到 3.1) | $2/$12 |
| gemini-3-flash-preview | 高速轻量 | 极速响应,成本最低 | 实时对话、批量处理、高频调用 | 更低 |
| gemini-3-pro-image-preview | 图片生成 | AI 文生图、图片编辑 | 创意设计、内容制作 | 按图计费 |
选择决策树:
- 需要最强推理和编码? →
gemini-3.1-pro-preview - 需要最快速度和最低成本? →
gemini-3-flash-preview - 需要生成图片? →
gemini-3-pro-image-preview - 已在用 3.0 Pro? → 直接升级到
gemini-3.1-pro-preview
什么场景不适合 Gemini 3.1 Pro Preview
虽然 3.1 Pro 在多数场景表现优异,但以下场景可能有更好的选择:
- 需要极致编码准确性: Claude Opus 4.6 的 SWE-Bench 80.9% 仍略高于 3.1 Pro 的 80.6%,差距虽小但在极端精度要求下可能有意义
- 需要极低延迟的实时应用: 3.1 Pro 的 high 思考模式延迟较高,此时 Gemini 3 Flash 或 Claude Sonnet 4.6 是更好的选择
- 需要稳定的 SLA 保证: Preview 模型不提供正式版的 SLA 承诺,对可用性要求极高的生产环境需评估风险
- 简单任务过度使用: 如果任务复杂度不高,使用 3.1 Pro 可能是成本浪费,Flash 系列更划算
Gemini 3.1 Pro Preview 的竞争优势总结
在 2026 年 2 月的 AI 模型格局中,Gemini 3.1 Pro Preview 的核心竞争优势可以归纳为 3 个「最」:
- 最大上下文: 1M tokens,是 Claude Opus 4.6 (200K) 的 5 倍
- 最低旗舰价: Input $2.00,是 Claude Opus 4.6 ($15.00) 的 13%
- 最强推理跃升: ARC-AGI-2 翻倍到 77.1%,推理维度领先所有竞品
相对劣势主要在纯编码场景(SWE-Bench 80.6% vs Claude Opus 80.9%,差距极小)和 Agent 生态成熟度上。
💡 综合建议: 对于大多数开发者来说,Gemini 3.1 Pro Preview 的性价比是当前旗舰模型中最优的。通过 API易 apiyi.com 可以在同一个平台上对比测试 Gemini、Claude、GPT 等所有主流模型,找到最适合自己场景的选择。
总结: 同价格翻倍升级,Gemini 3.1 Pro Preview 值得立即切换
Gemini 3.1 Pro Preview 是一次价格不变、能力翻倍的重大升级:
- 推理翻倍: ARC-AGI-2 从 ~35% 到 77.1%,是 3.0 的 2 倍以上
- 编码追平顶尖: SWE-Bench 80.6%,与 Claude Opus 4.6 仅差 0.3%
- Agent 能力飞跃: Terminal-Bench +20%,BrowseComp +45%,MCP Atlas +28%
- 效率全面提升: 输出 65K tokens,文件上限 100MB,效率 +15%
- 三级思考系统: high 模式等同 Deep Think Mini,按需调节推理预算
现在就通过 API易 apiyi.com 体验 Gemini 3.1 Pro Preview——统一接口、即刻可用,model 参数改为 gemini-3.1-pro-preview 即可完成升级。
参考资料
-
Google 官方博客: Gemini 3.1 Pro 发布公告
- 链接:
blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro - 说明: 官方功能介绍和基准成绩
- 链接:
-
Google DeepMind 模型卡: Gemini 3.1 Pro 技术细节
- 链接:
deepmind.google/models/model-cards/gemini-3-1-pro - 说明: 安全评估和详细参数
- 链接:
-
Gemini API 官方文档: 模型列表和调用方法
- 链接:
ai.google.dev/gemini-api/docs/models/gemini-3.1-pro-preview - 说明: API 参数、定价和使用指南
- 链接:
-
VentureBeat 报道: Gemini 3.1 Pro 首测印象
- 链接:
venturebeat.com/technology/google-gemini-3-1-pro-first-impressions - 说明: Deep Think Mini 特性和实际体验
- 链接:
-
MarkTechPost 分析: Gemini 3.1 Pro 技术解读
- 链接:
marktechpost.com/2026/02/19/google-ai-releases-gemini-3-1-pro - 说明: 基准测试数据和行业影响
- 链接:
📝 作者: APIYI Team | 技术交流请访问 API易 apiyi.com
📅 更新时间: 2026 年 2 月 20 日
🏷️ 关键词: Gemini 3.1 Pro Preview API, API易上线, 推理翻倍, SWE-Bench 80.6%, ARC-AGI-2 77.1%
