好消息——Gemini 3.1 Pro Preview 已在 API易上線,現在就可以通過 API 調用。模型名稱 gemini-3.1-pro-preview,提示價格 $2.00/1M tokens,補全價格 $12.00/1M tokens,與 Gemini 3.0 Pro Preview 價格完全一致。
但能力完全不在一個量級: Gemini 3.1 Pro 在 ARC-AGI-2 推理基準上達到 77.1%,是 3.0 Pro 的 2 倍以上; SWE-Bench Verified 編碼評分 80.6%,首次超越 Claude Opus 4.6 的 80.9% 形成正面競爭; 輸出效率提升 15%,用更少的 token 得到更可靠的結果。
核心價值: 本文將詳解 Gemini 3.1 Pro Preview 的 6 大核心升級、API 調用方法、與競品的詳細對比,以及在不同場景下的最佳實踐。

Gemini 3.1 Pro Preview 核心參數一覽
| 參數項 | 詳情 |
|---|---|
| 模型名稱 | gemini-3.1-pro-preview |
| 發佈日期 | 2026 年 2 月 19 日 |
| 提示價格 (≤200K tokens) | $2.00 / 百萬 tokens |
| 補全價格 (≤200K tokens) | $12.00 / 百萬 tokens |
| 提示價格 (>200K tokens) | $4.00 / 百萬 tokens |
| 補全價格 (>200K tokens) | $18.00 / 百萬 tokens |
| 上下文窗口 | 1,000,000 tokens (1M) |
| 最大輸出 | 65,000 tokens (65K) |
| 文件上傳上限 | 100MB (原 20MB) |
| 知識截止日期 | 2025 年 1 月 |
| API易可用狀態 | ✅ 已上線 |
🚀 即刻體驗: Gemini 3.1 Pro Preview 已在 API易 apiyi.com 上線,通過 OpenAI 兼容格式即可調用,無需註冊谷歌賬號,5 分鐘完成集成。
Gemini 3.1 Pro Preview 的 6 大核心升級
升級 1: 推理性能翻倍——ARC-AGI-2 達到 77.1%
這是最引人注目的升級。在 ARC-AGI-2 基準測試中(評估模型解決全新邏輯模式的能力),Gemini 3.1 Pro 達到 77.1%,是 Gemini 3.0 Pro 的 2 倍以上。
同時,在 MCP Atlas 基準(衡量使用 Model Context Protocol 的多步驟工作流能力)上,3.1 Pro 達到 69.2%,比 3.0 Pro 的 54.1% 提升了 15 個百分點。
這意味着在複雜推理、多步邏輯鏈條、Agent 工作流等場景中,Gemini 3.1 Pro 有了質的飛躍。
升級 2: 三級思考深度系統——Deep Think Mini
Gemini 3.1 Pro 引入了全新的三級思考深度系統,開發者可以根據任務複雜度靈活調節「推理預算」:
| 思考級別 | 行爲特徵 | 適用場景 | 延遲影響 |
|---|---|---|---|
| high | 類似 Gemini Deep Think 的迷你版,深度推理 | 數學證明、複雜調試、策略規劃 | 較高 |
| medium | 相當於 3.0 Pro 的 high 級別 | 代碼審查、技術分析、架構設計 | 適中 |
| low | 快速響應,最小推理開銷 | 數據提取、格式轉換、簡單問答 | 最低 |
關鍵點: 3.1 Pro 的 high 級別重新定義了含義——它現在是 Gemini Deep Think 的「迷你版」,推理深度遠超 3.0 Pro 的 high。而 3.1 的 medium 大致等於 3.0 的 high,這意味着即使用 medium 也能獲得原來最高級別的推理質量。
升級 3: 編碼能力躋身頂尖——SWE-Bench 80.6%
Gemini 3.1 Pro 在編碼領域的表現堪稱飛躍:
| 編碼基準 | Gemini 3.0 Pro | Gemini 3.1 Pro | 提升幅度 |
|---|---|---|---|
| SWE-Bench Verified | 76.8% | 80.6% | +3.8% |
| Terminal-Bench 2.0 | 56.9% | 68.5% | +11.6% |
| LiveCodeBench Pro | — | Elo 2887 | 新基準 |
SWE-Bench Verified 80.6% 的成績意味着 Gemini 3.1 Pro 在軟件工程任務上已經與 Claude Opus 4.6 (80.9%) 幾乎持平,差距僅 0.3 個百分點。
Terminal-Bench 2.0 評估的是 Agent 終端編碼能力——從 56.9% 到 68.5% 的提升,說明 3.1 Pro 在 Agentic 場景中的可靠性大幅增強。
升級 4: 輸出能力和效率全面提升
| 能力項 | Gemini 3.0 Pro | Gemini 3.1 Pro | 改進 |
|---|---|---|---|
| 最大輸出 tokens | 不詳 | 65,000 (65K) | 大幅提升 |
| 文件上傳上限 | 20MB | 100MB | 5 倍 |
| YouTube URL 支持 | ❌ | ✅ | 新增 |
| 輸出效率 | 基準 | +15% | 更少 token 更可靠結果 |
65K 的輸出上限意味着模型可以一次性生成完整的長文檔、大段代碼或詳細的分析報告,無需多次請求拼接。
文件上傳從 20MB 擴展到 100MB,結合 1M token 上下文,可以直接分析大型代碼倉庫、長視頻或大量文檔。
YouTube URL 直接傳入是一個實用的新功能——開發者可以在 prompt 中直接傳入 YouTube 鏈接,模型會自動分析視頻內容,無需手動下載上傳。
升級 5: customtools 專用端點——Agent 開發利器
谷歌還同步推出了 gemini-3.1-pro-preview-customtools 專用端點,這是一個針對 Agent 開發場景深度優化的版本:
- 工具調用優先級優化: 專門調優了
view_file、search_code等開發者常用工具的調用優先級 - Bash + 自定義函數混合: 特別適合需要在 bash 命令和自定義函數之間切換的 Agent 工作流
- Agentic 場景穩定性: 在多步驟 Agent 任務中的可靠性高於通用版本
這意味着如果你正在構建 AI 編程助手、代碼審查 Bot、自動化運維 Agent 等工具,customtools 端點是更好的選擇。
升級 6: 網絡搜索能力飛躍——BrowseComp 85.9%
BrowseComp 基準測試評估模型的 Agent 網絡搜索能力,Gemini 3.1 Pro 達到 85.9%,而 3.0 Pro 僅爲 59.2%——提升幅度達 26.7 個百分點。
這項能力對於需要實時信息檢索的應用(如研究助手、競品分析、新聞摘要)有重大意義。
💡 技術洞察: Gemini 3.1 Pro 還推出了專門的
gemini-3.1-pro-preview-customtools端點,專爲混合 bash 命令和自定義函數的開發者優化,特別調優了view_file、search_code等工具的優先級。通過 API易 apiyi.com 可以直接調用此專用端點。
Gemini 3.1 Pro Preview API 調用實戰
極簡調用示例 (Python)
import openai
client = openai.OpenAI(
api_key="YOUR_API_KEY",
base_url="https://api.apiyi.com/v1" # API易統一接口
)
response = client.chat.completions.create(
model="gemini-3.1-pro-preview",
messages=[
{"role": "user", "content": "分析這段代碼的時間複雜度並給出優化建議:\n\ndef two_sum(nums, target):\n for i in range(len(nums)):\n for j in range(i+1, len(nums)):\n if nums[i] + nums[j] == target:\n return [i, j]"}
]
)
print(response.choices[0].message.content)
查看完整調用示例 (含思考深度控制和多模態)
import openai
import base64
client = openai.OpenAI(
api_key="YOUR_API_KEY",
base_url="https://api.apiyi.com/v1" # API易統一接口
)
# 示例 1: 高推理深度 - 複雜數學推理
response_math = client.chat.completions.create(
model="gemini-3.1-pro-preview",
messages=[{
"role": "user",
"content": "證明: 對於所有正整數 n, n^3 - n 必然能被 6 整除。請給出嚴格的數學證明。"
}],
temperature=0.2,
max_tokens=4096
)
# 示例 2: 多模態分析 - 圖片理解
with open("architecture.png", "rb") as f:
img_data = base64.b64encode(f.read()).decode()
response_vision = client.chat.completions.create(
model="gemini-3.1-pro-preview",
messages=[{
"role": "user",
"content": [
{"type": "text", "text": "詳細分析這張系統架構圖,指出潛在的性能瓶頸和改進建議"},
{"type": "image_url", "image_url": {"url": f"data:image/png;base64,{img_data}"}}
]
}],
max_tokens=8192
)
# 示例 3: 長上下文代碼分析
with open("large_codebase.txt", "r") as f:
code_content = f.read() # 可達數十萬 tokens
response_code = client.chat.completions.create(
model="gemini-3.1-pro-preview",
messages=[
{"role": "system", "content": "你是一位資深軟件架構師,請仔細分析整個代碼倉庫。"},
{"role": "user", "content": f"以下是完整代碼倉庫:\n\n{code_content}\n\n請分析:\n1. 整體架構設計\n2. 潛在的 bug\n3. 性能優化建議\n4. 代碼重構方案"}
],
max_tokens=16384 # 利用 65K 輸出能力
)
print(f"數學推理: {response_math.choices[0].message.content[:200]}...")
print(f"視覺分析: {response_vision.choices[0].message.content[:200]}...")
print(f"代碼分析: {response_code.choices[0].message.content[:200]}...")
🎯 接入提示: 通過 API易 apiyi.com 調用 Gemini 3.1 Pro Preview,使用標準 OpenAI SDK 即可,無需安裝額外依賴。已有 OpenAI 格式項目只需修改
base_url和model參數即可切換。
Gemini 3.1 Pro Preview 與競品詳細對比

關鍵基準綜合對比表
| 基準測試 | Gemini 3.1 Pro | Claude Opus 4.6 | Claude Sonnet 4.6 | 勝出 |
|---|---|---|---|---|
| SWE-Bench Verified | 80.6% | 80.9% | 79.6% | Claude Opus (微弱) |
| ARC-AGI-2 | 77.1% | ~65% | — | Gemini 3.1 Pro |
| Terminal-Bench 2.0 | 68.5% | — | — | Gemini 3.1 Pro |
| BrowseComp | 85.9% | ~71% | — | Gemini 3.1 Pro |
| MCP Atlas | 69.2% | — | — | Gemini 3.1 Pro |
| 上下文窗口 | 1M tokens | 200K | 200K | Gemini 3.1 Pro |
| 最大輸出 | 65K | — | — | Gemini 3.1 Pro |
| Input 價格 | $2.00 | $15.00 | $3.00 | Gemini 3.1 Pro |
| 可用平臺 | API易 apiyi.com 等 | API易 apiyi.com 等 | API易 apiyi.com 等 | — |
各模型適用場景建議
| 使用場景 | 推薦模型 | 核心原因 |
|---|---|---|
| 複雜推理與數學 | Gemini 3.1 Pro Preview | ARC-AGI-2 77.1%,推理翻倍 |
| 超長文檔/代碼倉庫分析 | Gemini 3.1 Pro Preview | 1M token 上下文,獨此一家 |
| Agentic 編程 | Claude Opus 4.6 / Gemini 3.1 Pro | SWE-Bench 幾乎持平 |
| Agent 搜索工作流 | Gemini 3.1 Pro Preview | BrowseComp 85.9% 大幅領先 |
| 中等複雜度日常編碼 | Claude Sonnet 4.6 | 性價比高,79.6% 編碼 |
| 預算優先的旗艦需求 | Gemini 3.1 Pro Preview | $2/$12,旗艦最低價 |
| 視頻/音頻多模態分析 | Gemini 3.1 Pro Preview | 原生多模態,YouTube URL 支持 |
💰 成本對比: 同等旗艦級能力,Gemini 3.1 Pro 的 Input 價格 ($2.00) 僅爲 Claude Opus 4.6 ($15.00) 的 13%。對於推理和多模態場景,性價比優勢極爲明顯。通過 API易 apiyi.com 平臺可以用同一個接口快速切換測試。
Gemini 3.1 Pro Preview 最佳實踐
善用三級思考深度
# 複雜推理用 high (Deep Think Mini 模式)
# 日常任務用 medium (等價於舊版 high)
# 簡單任務用 low (最快響應)
# 在 API易 調用時,通過 extra_body 傳遞思考級別
response = client.chat.completions.create(
model="gemini-3.1-pro-preview",
messages=[{"role": "user", "content": "你的問題"}],
extra_body={"thinking_level": "high"} # high/medium/low
)
充分利用 1M Token 上下文窗口
Gemini 3.1 Pro Preview 的 1M token 上下文窗口是當前所有旗艦模型中最大的。以下是幾個高價值使用場景:
代碼倉庫全局分析: 將數十個文件一次性傳入,讓模型理解完整架構後給出重構建議。這比逐文件分析更能發現跨模塊的耦合問題和全局優化機會。
長文檔深度理解: 法律合同、技術規格書、學術論文集——1M token 可以裝下一本完整的書。結合 3.1 Pro 增強的推理深度,長文檔中的隱含關聯也能被識別出來。
YouTube 視頻分析 (新功能): 直接在 prompt 中傳入 YouTube URL,無需下載和上傳視頻文件。模型會自動分析視頻內容,適合內容審覈、競品分析、教程總結等場景。
多輪對話長期記憶: 1M token 窗口意味着模型可以「記住」極長的對話歷史,在需要大量上下文的客服、諮詢、教學場景中優勢明顯。
注意 200K 價格閾值: 當輸入超過 200K tokens 時,價格從 $2/$12 翻倍到 $4/$18。建議在使用長上下文時先評估實際 token 數,對於 200K-300K 之間的場景,考慮精簡輸入以控制在 200K 以內可以節省一半成本。
customtools 端點的使用方式
如果你在構建 Agent 應用,gemini-3.1-pro-preview-customtools 端點值得優先考慮:
# Agent 開發專用端點
response = client.chat.completions.create(
model="gemini-3.1-pro-preview-customtools", # Agent 優化版本
messages=[{"role": "user", "content": "查找項目中所有未處理的異常並給出修復建議"}],
tools=[
{"type": "function", "function": {"name": "search_code", "description": "搜索代碼"}},
{"type": "function", "function": {"name": "view_file", "description": "查看文件"}},
]
)
該端點在工具調用的準確性和可靠性上優於通用版本,特別適合 bash 命令與自定義函數混合使用的場景。
成本優化策略
| 策略 | 方法 | 預期節省 |
|---|---|---|
| 思考級別按需切換 | 簡單任務用 low,複雜任務才用 high | 30-50% |
| 利用長上下文減少請求 | 將多個相關問題合併爲一次請求 | 20-40% |
| >200K token 場景注意 | 超過 200K 時價格翻倍,控制輸入長度 | 避免 2x 溢價 |
| 輸出 token 控制 | 設置合理的 max_tokens 避免冗餘輸出 | 10-20% |
| 選擇合適的 Gemini 模型 | 簡單任務用 Flash,複雜任務才用 3.1 Pro | 60-80% |
從 Gemini 3.0 Pro 遷移到 3.1 Pro 的步驟
遷移過程極其簡單,以下是完整步驟:
第一步: 修改 model 參數
# 舊版
model="gemini-3-pro-preview"
# 新版
model="gemini-3.1-pro-preview"
第二步: 測試核心功能——在你的主要使用場景中跑幾個典型 case,確認輸出質量符合預期。
第三步: 探索新能力——嘗試 high 思考級別的深度推理、100MB 文件上傳、YouTube URL 分析等 3.1 新增功能。
第四步: 優化成本——根據不同任務設置合適的思考級別,用 medium 替代 high 處理日常任務,可以在保持質量的同時降低延遲和 token 消耗。
🎯 遷移建議: 在 API易 apiyi.com 平臺上,遷移只需修改一個參數。建議先保留舊模型調用作爲 fallback,確認 3.1 穩定後再全量切換。

常見問題
Q1: Gemini 3.1 Pro Preview 在 API易 上的調用方式和之前的 Gemini 模型一樣嗎?
完全一樣。在 API易 apiyi.com 平臺上,Gemini 3.1 Pro Preview 使用標準 OpenAI 兼容格式,model 參數填寫 gemini-3.1-pro-preview 即可。如果你已經在用 Gemini 3.0 Pro,只需修改 model 名稱,其他代碼無需任何改動。
Q2: 3.1 Pro 和 3.0 Pro 價格一樣,有必要切換嗎?
強烈建議切換。價格完全相同 ($2/$12),但推理能力翻倍、編碼從 76.8% 提升到 80.6%、輸出效率提升 15%。這是純粹的免費升級,沒有不切換的理由。通過 API易 apiyi.com 只需改一個參數即可完成切換。
Q3: 三級思考深度怎麼選? 會影響價格嗎?
思考深度主要影響延遲和 token 消耗。high 級別推理更深但消耗更多輸出 token 和時間,low 級別最快但推理淺。建議日常用 medium (等價於舊版 high 的質量),只在複雜推理場景使用 high。價格按實際 token 消耗計費,思考級別本身不額外收費。
Q4: Gemini 3.1 Pro Preview 和 Claude Opus 4.6 該選哪個?
看場景和預算:如果你需要超長上下文 (1M vs 200K)、多模態分析 (視頻/YouTube)、或對價格敏感 ($2 vs $15),選 Gemini 3.1 Pro;如果你追求極致編碼 (80.9% vs 80.6%) 和成熟的 Agent 生態,選 Claude Opus 4.6。兩者在 API易 apiyi.com 都可以用同一個接口調用,方便 A/B 測試。
Gemini 3 系列模型全景選擇指南
Gemini 3 系列目前已有多個可用模型,不同場景應選擇不同版本:
| 模型 | 定位 | 核心優勢 | 適用場景 | API易價格 |
|---|---|---|---|---|
| gemini-3.1-pro-preview | 旗艦推理 (NEW) | 推理翻倍,編碼頂尖 | 複雜推理、代碼生成、Agent | $2/$12 |
| gemini-3-pro-preview | 旗艦通用 | Agentic 編程、多模態 | 通用任務 (建議升級到 3.1) | $2/$12 |
| gemini-3-flash-preview | 高速輕量 | 極速響應,成本最低 | 實時對話、批量處理、高頻調用 | 更低 |
| gemini-3-pro-image-preview | 圖片生成 | AI 文生圖、圖片編輯 | 創意設計、內容製作 | 按圖計費 |
選擇決策樹:
- 需要最強推理和編碼? →
gemini-3.1-pro-preview - 需要最快速度和最低成本? →
gemini-3-flash-preview - 需要生成圖片? →
gemini-3-pro-image-preview - 已在用 3.0 Pro? → 直接升級到
gemini-3.1-pro-preview
什麼場景不適合 Gemini 3.1 Pro Preview
雖然 3.1 Pro 在多數場景表現優異,但以下場景可能有更好的選擇:
- 需要極致編碼準確性: Claude Opus 4.6 的 SWE-Bench 80.9% 仍略高於 3.1 Pro 的 80.6%,差距雖小但在極端精度要求下可能有意義
- 需要極低延遲的實時應用: 3.1 Pro 的 high 思考模式延遲較高,此時 Gemini 3 Flash 或 Claude Sonnet 4.6 是更好的選擇
- 需要穩定的 SLA 保證: Preview 模型不提供正式版的 SLA 承諾,對可用性要求極高的生產環境需評估風險
- 簡單任務過度使用: 如果任務複雜度不高,使用 3.1 Pro 可能是成本浪費,Flash 系列更划算
Gemini 3.1 Pro Preview 的競爭優勢總結
在 2026 年 2 月的 AI 模型格局中,Gemini 3.1 Pro Preview 的核心競爭優勢可以歸納爲 3 個「最」:
- 最大上下文: 1M tokens,是 Claude Opus 4.6 (200K) 的 5 倍
- 最低旗艦價: Input $2.00,是 Claude Opus 4.6 ($15.00) 的 13%
- 最強推理躍升: ARC-AGI-2 翻倍到 77.1%,推理維度領先所有競品
相對劣勢主要在純編碼場景(SWE-Bench 80.6% vs Claude Opus 80.9%,差距極小)和 Agent 生態成熟度上。
💡 綜合建議: 對於大多數開發者來說,Gemini 3.1 Pro Preview 的性價比是當前旗艦模型中最優的。通過 API易 apiyi.com 可以在同一個平臺上對比測試 Gemini、Claude、GPT 等所有主流模型,找到最適合自己場景的選擇。
總結: 同價格翻倍升級,Gemini 3.1 Pro Preview 值得立即切換
Gemini 3.1 Pro Preview 是一次價格不變、能力翻倍的重大升級:
- 推理翻倍: ARC-AGI-2 從 ~35% 到 77.1%,是 3.0 的 2 倍以上
- 編碼追平頂尖: SWE-Bench 80.6%,與 Claude Opus 4.6 僅差 0.3%
- Agent 能力飛躍: Terminal-Bench +20%,BrowseComp +45%,MCP Atlas +28%
- 效率全面提升: 輸出 65K tokens,文件上限 100MB,效率 +15%
- 三級思考系統: high 模式等同 Deep Think Mini,按需調節推理預算
現在就通過 API易 apiyi.com 體驗 Gemini 3.1 Pro Preview——統一接口、即刻可用,model 參數改爲 gemini-3.1-pro-preview 即可完成升級。
參考資料
-
Google 官方博客: Gemini 3.1 Pro 發佈公告
- 鏈接:
blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro - 說明: 官方功能介紹和基準成績
- 鏈接:
-
Google DeepMind 模型卡: Gemini 3.1 Pro 技術細節
- 鏈接:
deepmind.google/models/model-cards/gemini-3-1-pro - 說明: 安全評估和詳細參數
- 鏈接:
-
Gemini API 官方文檔: 模型列表和調用方法
- 鏈接:
ai.google.dev/gemini-api/docs/models/gemini-3.1-pro-preview - 說明: API 參數、定價和使用指南
- 鏈接:
-
VentureBeat 報道: Gemini 3.1 Pro 首測印象
- 鏈接:
venturebeat.com/technology/google-gemini-3-1-pro-first-impressions - 說明: Deep Think Mini 特性和實際體驗
- 鏈接:
-
MarkTechPost 分析: Gemini 3.1 Pro 技術解讀
- 鏈接:
marktechpost.com/2026/02/19/google-ai-releases-gemini-3-1-pro - 說明: 基準測試數據和行業影響
- 鏈接:
📝 作者: APIYI Team | 技術交流請訪問 API易 apiyi.com
📅 更新時間: 2026 年 2 月 20 日
🏷️ 關鍵詞: Gemini 3.1 Pro Preview API, API易上線, 推理翻倍, SWE-Bench 80.6%, ARC-AGI-2 77.1%
