|

Gemini 3.1 Pro Preview APIがAPIYIでリリース:推論性能を2倍に向上させた6大コアアップデートの解説

好消息——Gemini 3.1 Pro Preview 已在 APIYI上线,现在就可以通过 API 调用。模型名称 gemini-3.1-pro-preview,提示价格 $2.00/1M tokens,补全价格 $12.00/1M tokens,与 Gemini 3.0 Pro Preview 价格完全一致。

但能力完全不在一个量级: Gemini 3.1 Pro 在 ARC-AGI-2 推理基准上达到 77.1%,是 3.0 Pro 的 2 倍以上; SWE-Bench Verified 编码评分 80.6%,首次超越 Claude Opus 4.6 的 80.9% 形成正面竞争; 输出效率提升 15%,用更少的 token 得到更可靠的结果。

核心价值: 本文将详解 Gemini 3.1 Pro Preview 的 6 大核心升级、API 调用方法、与竞品的详细对比,以及在不同场景下的最佳实践。

gemini-3-1-pro-preview-api-available-apiyi-guide-ja 图示


Gemini 3.1 Pro Preview 核心参数一览

参数项 详情
模型名称 gemini-3.1-pro-preview
发布日期 2026 年 2 月 19 日
提示价格 (≤200K tokens) $2.00 / 百万 tokens
补全价格 (≤200K tokens) $12.00 / 百万 tokens
提示价格 (>200K tokens) $4.00 / 百万 tokens
补全价格 (>200K tokens) $18.00 / 百万 tokens
上下文窗口 1,000,000 tokens (1M)
最大输出 65,000 tokens (65K)
文件上传上限 100MB (原 20MB)
知识截止日期 2025 年 1 月
APIYI可用状态 ✅ 已上线

🚀 即刻体验: Gemini 3.1 Pro Preview 已在 APIYI apiyi.com 上线,通过 OpenAI 兼容格式即可调用,无需注册谷歌账号,5 分钟完成集成。


Gemini 3.1 Pro Preview 6つの主要アップデート

アップデート 1: 推論性能が倍増——ARC-AGI-2で77.1%を達成

今回のアップデートで最も注目すべき点です。未知の論理パターンを解決する能力を評価するARC-AGI-2ベンチマークにおいて、Gemini 3.1 Proは77.1%を記録しました。これはGemini 3.0 Proの2倍以上のスコアです。

また、Model Context Protocolを用いたマルチステップのワークフロー能力を測定するMCP Atlasベンチマークでは、3.1 Proが69.2%に達し、3.0 Proの54.1%から15ポイント向上しました。

これは、複雑な推論、多段階の論理チェーン、エージェントのワークフローといったシナリオにおいて、Gemini 3.1 Proが質的な飛躍を遂げたことを意味しています。

アップデート 2: 3段階の思考深度システム——Deep Think Mini

Gemini 3.1 Proでは、新たに3段階の思考深度システムが導入されました。開発者はタスクの複雑さに応じて「推論予算」を柔軟に調整できます。

思考レベル 行動特性 活用シーン 遅延への影響
high Gemini Deep Thinkのミニ版に近い深い推論 数学的証明、複雑なデバッグ、戦略立案 高め
medium 3.0 Proのhighレベルに相当 コードレビュー、技術分析、アーキテクチャ設計 適度
low 高速レスポンス、最小限の推論コスト データ抽出、フォーマット変換、簡単な質疑応答 最低

重要なポイント:3.1 Proのhighレベルは意味合いが一新されました。これは現在、Gemini Deep Thinkの「ミニ版」となっており、推論の深さは3.0 Proのhighを遥かに凌駕します。一方で3.1のmediumが従来の3.0のhighとほぼ同等であるため、mediumを使用するだけでも、以前の最高レベルの推論品質を得ることができます。

アップデート 3: コーディング能力がトップクラスに到達——SWE-Bench 80.6%

Gemini 3.1 Proのコーディング分野における進化は目覚ましいものがあります。

コーディングベンチマーク Gemini 3.0 Pro Gemini 3.1 Pro 向上幅
SWE-Bench Verified 76.8% 80.6% +3.8%
Terminal-Bench 2.0 56.9% 68.5% +11.6%
LiveCodeBench Pro Elo 2887 新ベンチマーク

SWE-Bench Verifiedで80.6%という成績は、Gemini 3.1 ProがソフトウェアエンジニアリングタスクにおいてClaude 3.5 SonnetやClaude 4.6 (80.9%) とほぼ肩を並べ、その差がわずか0.3ポイントであることを示しています。

Terminal-Bench 2.0は、エージェントのターミナル操作によるコーディング能力を評価するものです。56.9%から68.5%への向上は、エージェント(Agentic)シナリオにおける3.1 Proの信頼性が大幅に強化されたことを裏付けています。

アップデート 4: 出力能力と効率の全面的な向上

項目 Gemini 3.0 Pro Gemini 3.1 Pro 改善点
最大出力トークン 不明 65,000 (65K) 大幅向上
ファイルアップロード上限 20MB 100MB 5倍
YouTube URL対応 新機能
出力効率 基準 +15% より少ないトークンでより信頼性の高い結果

65Kの出力上限により、モデルは長大なドキュメント、大規模なコードブロック、詳細な分析レポートを、複数回に分けてリクエストすることなく一度に生成できるようになりました。

ファイルアップロードが20MBから100MBに拡張され、100万トークンのコンテキストウィンドウと組み合わせることで、大規模なコードリポジトリ、長尺動画、大量のドキュメントを直接分析することが可能です。

YouTube URLの直接入力は非常に実用的な新機能です。開発者はプロンプトにYouTubeのリンクを直接含めることができ、モデルが自動的に動画内容を分析します。手動でダウンロードしてアップロードする手間が省けます。

アップデート 5: customtools専用エンドポイント——エージェント開発の強力な武器

Googleは同時に、エージェント開発シナリオ向けに深く最適化されたgemini-3.1-pro-preview-customtools専用エンドポイントをリリースしました。

  • ツール呼び出しの優先順位の最適化: view_filesearch_codeなど、開発者が頻繁に使用するツールの呼び出し優先順位が調整されています。
  • Bashとカスタム関数のハイブリッド: Bashコマンドとカスタム関数を切り替える必要があるエージェントのワークフローに特に適しています。
  • エージェントシナリオの安定性: マルチステップのエージェントタスクにおいて、汎用バージョンよりも高い信頼性を発揮します。

AIプログラミングアシスタント、コードレビューBot、自動運用エージェントなどを構築している場合、customtoolsエンドポイントが最適な選択肢となります。

アップデート 6: ウェブ検索能力の飛躍——BrowseComp 85.9%

BrowseCompベンチマークは、モデルのエージェントによるウェブ検索能力を評価します。Gemini 3.1 Proは85.9%に達し、3.0 Proの59.2%から26.7ポイントという驚異的な向上を見せました。

この能力は、リアルタイムの情報検索を必要とするアプリケーション(リサーチアシスタント、競合分析、ニュース要約など)において大きな意義を持ちます。

💡 技術インサイト: Gemini 3.1 Proには、Bashコマンドとカスタム関数を併用する開発者向けに最適化されたgemini-3.1-pro-preview-customtoolsエンドポイントも用意されており、view_filesearch_codeといったツールの優先順位が特別に調整されています。APIYI (apiyi.com) を通じて、この専用エンドポイントを直接呼び出すことが可能です。


Gemini 3.1 Pro Preview API 活用ガイド

シンプルな呼び出し例 (Python)

import openai

client = openai.OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com/v1"  # APIYI统一接口
)

response = client.chat.completions.create(
    model="gemini-3.1-pro-preview",
    messages=[
        {"role": "user", "content": "分析这段代码的时间复杂度并给出优化建议:\n\ndef two_sum(nums, target):\n    for i in range(len(nums)):\n        for j in range(i+1, len(nums)):\n            if nums[i] + nums[j] == target:\n                return [i, j]"}
    ]
)
print(response.choices[0].message.content)
完全な呼び出し例を表示(思考深度の制御とマルチモーダルを含む)
import openai
import base64

client = openai.OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com/v1"  # APIYI统一接口
)

# 示例 1: 高推理深度 - 复杂数学推理
response_math = client.chat.completions.create(
    model="gemini-3.1-pro-preview",
    messages=[{
        "role": "user",
        "content": "证明: 对于所有正整数 n, n^3 - n 必然能被 6 整除。请给出严格的数学证明。"
    }],
    temperature=0.2,
    max_tokens=4096
)

# 示例 2: 多模态分析 - 图片理解
with open("architecture.png", "rb") as f:
    img_data = base64.b64encode(f.read()).decode()

response_vision = client.chat.completions.create(
    model="gemini-3.1-pro-preview",
    messages=[{
        "role": "user",
        "content": [
            {"type": "text", "text": "详细分析这张系统架构图,指出潜在的性能瓶颈和改进建议"},
            {"type": "image_url", "image_url": {"url": f"data:image/png;base64,{img_data}"}}
        ]
    }],
    max_tokens=8192
)

# 示例 3: 长上下文代码 analysis
with open("large_codebase.txt", "r") as f:
    code_content = f.read()  # 可达数十万 tokens

response_code = client.chat.completions.create(
    model="gemini-3.1-pro-preview",
    messages=[
        {"role": "system", "content": "你是一位资深软件架构师,请仔细分析整个代码仓库。"},
        {"role": "user", "content": f"以下是完整代码仓库:\n\n{code_content}\n\n请分析:\n1. 整体架构设计\n2. 潜在的 bug\n3. 性能优化建议\n4. 代码重構方案"}
    ],
    max_tokens=16384  # 利用 65K 输出能力
)

print(f"数学推理: {response_math.choices[0].message.content[:200]}...")
print(f"视觉分析: {response_vision.choices[0].message.content[:200]}...")
print(f"代码分析: {response_code.choices[0].message.content[:200]}...")

🎯 導入ヒント: APIYI (apiyi.com) を通じてGemini 3.1 Pro Previewを呼び出す際は、標準のOpenAI SDKを使用でき、追加のライブラリをインストールする必要はありません。既存のOpenAI形式のプロジェクトであれば、base_urlmodelパラメータを変更するだけで簡単に切り替えが可能です。


Gemini 3.1 Pro Preview と競合モデルの詳細比較





Gemini 3.1 Pro vs Claude Opus 4.6 vs Sonnet 4.6 ベンチマーク比較
2026 年 2 月最新数据 | 关键基准分数直观对比

SWE-Bench Verified (コーディング)


Gemini 3.1 Pro 80.6%


Claude Opus 4.6 80.9%


よくある質問

Q1: APIYI での Gemini 3.1 Pro Preview の呼び出し方法は、これまでの Gemini モデルと同じですか?

全く同じです。APIYI(apiyi.com)プラットフォームでは、Gemini 3.1 Pro Preview は標準的な OpenAI 互換フォーマットを使用しており、model パラメータに gemini-3.1-pro-preview と入力するだけです。すでに Gemini 3.0 Pro をお使いの場合は、モデル名を変更するだけで、他のコードを修正する必要はありません。

Q2: 3.1 Pro と 3.0 Pro の価格は同じですが、切り替える必要はありますか?

切り替えることを強くおすすめします。価格は全く同じ($2/$12)ですが、推論能力は 2 倍になり、コーディング能力は 76.8% から 80.6% へ向上、出力効率も 15% アップしています。これは純粋な無料アップグレードですので、切り替えない理由はありません。APIYI(apiyi.com)経由なら、パラメータを一つ変えるだけで完了します。

Q3: 3 段階の思考深度(Thinking Depth)はどう選べばいいですか?価格に影響しますか?

思考深度は主に遅延(レイテンシ)とトークン消費量に影響します。「high」レベルは推論がより深くなりますが、出力トークンと時間がより多く消費されます。「low」レベルは最も高速ですが推論は浅くなります。日常的には「medium」(旧バージョンの high 相当の品質)を使用し、複雑な推論が必要なシーンでのみ「high」を使用することをおすすめします。料金は実際のトークン消費量に基づいて計算され、思考レベル自体に追加料金はかかりません。

Q4: Gemini 3.1 Pro Preview と Claude Opus 4.6、どちらを選ぶべきですか?

利用シーンと予算によります。超長文コンテキスト(1M vs 200K)、マルチモーダル分析(動画/YouTube)、または価格を重視する場合($2 vs $15)は Gemini 3.1 Pro を選んでください。究極のコーディング精度(80.9% vs 80.6%)や成熟したエージェントエコシステムを求めるなら Claude Opus 4.6 が適しています。APIYI(apiyi.com)ではどちらも同じインターフェースで呼び出せるため、A/B テストも簡単です。


Gemini 3 シリーズモデル全景選択ガイド

Gemini 3 シリーズには現在、複数の利用可能なモデルがあります。シーンに合わせて最適なバージョンを選択してください。

モデル 位置づけ コアメリット 適用シーン APIYI 価格
gemini-3.1-pro-preview フラッグシップ推論 (NEW) 推論能力が倍増、トップクラスのコーディング 複雑な推論、コード生成、エージェント $2/$12
gemini-3-pro-preview フラッグシップ汎用 エージェンティック・プログラミング、マルチモーダル 汎用タスク(3.1 へのアップグレードを推奨) $2/$12
gemini-3-flash-preview 高速・軽量 超高速レスポンス、最低コスト リアルタイム対話、バッチ処理、高頻度呼び出し さらに低価格
gemini-3-pro-image-preview 画像生成 AI 画像生成、画像編集 クリエイティブデザイン、コンテンツ制作 画像ごとの課金

選択の意思決定ツリー:

  • 最強の推論とコーディングが必要? → gemini-3.1-pro-preview
  • 最速のスピードと最低コストが必要? → gemini-3-flash-preview
  • 画像生成が必要? → gemini-3-pro-image-preview
  • すでに 3.0 Pro を使用中? → 直接 gemini-3.1-pro-preview へアップグレード

Gemini 3.1 Pro Preview が適さないシーン

3.1 Pro は多くのシーンで優れたパフォーマンスを発揮しますが、以下のようなケースでは他の選択肢の方が良い場合があります。

  • 究極のコーディング正確性が必要な場合: Claude Opus 4.6 の SWE-Bench スコアは 80.9% であり、3.1 Pro の 80.6% をわずかに上回っています。差は小さいですが、極限の精度が求められる場合には意味を持つかもしれません。
  • 超低遅延のリアルタイムアプリケーション: 3.1 Pro の「high」思考モードは遅延が大きいため、そのような場合は Gemini 3 Flash や Claude Sonnet 4.6 が適しています。
  • 安定した SLA 保証が必要な場合: Preview モデルは正式版のような SLA(サービス品質保証)を提供していません。可用性が極めて重要な本番環境ではリスク評価が必要です。
  • 単純なタスクでの過剰利用: タスクの複雑度が低い場合、3.1 Pro を使用するのはコストの無駄になる可能性があります。Flash シリーズの方がコストパフォーマンスに優れています。

Gemini 3.1 Pro Preview の競争優位性のまとめ

2026 年 2 月時点の AI モデル勢力図において、Gemini 3.1 Pro Preview の核心的な競争優位性は、以下の 3 つの「最大・最強・最安」に集約されます。

  1. 最大コンテキスト: 1M トークン。これは Claude Opus 4.6 (200K) の 5 倍に相当します。
  2. フラッグシップ最安値: 入力 $2.00。Claude Opus 4.6 ($15.00) のわずか 13% のコストです。
  3. 最強の推論の飛躍: ARC-AGI-2 スコアが 77.1% へと倍増し、推論の次元で競合他社をリードしています。

相対的な弱点は、純粋なコーディングシーン(SWE-Bench 80.6% vs Claude Opus 80.9%、差は極僅か)と、エージェントエコシステムの成熟度にあります。

💡 総合的なアドバイス: ほとんどの開発者にとって、Gemini 3.1 Pro Preview のコストパフォーマンスは現在のフラッグシップモデルの中で最高です。APIYI(apiyi.com)を利用すれば、同じプラットフォーム上で Gemini、Claude、GPT などの主要モデルを比較テストし、自分のプロジェクトに最適な選択肢を見つけることができます。


まとめ:価格は据え置きで性能は2倍に。Gemini 3.1 Pro Previewへ今すぐ切り替えるべき理由

Gemini 3.1 Pro Previewは、価格はそのままに、能力が2倍になった重大なアップグレードです。

  1. 推論能力が倍増: ARC-AGI-2のスコアが約35%から77.1%へと向上し、3.0の2倍以上に達しました。
  2. コーディング能力がトップレベルに到達: SWE-Benchで80.6%を記録。Claude Opusの4.6%に対し、わずか0.3%差まで迫っています。
  3. エージェント能力の飛躍的な進化: Terminal-Benchで+20%、BrowseCompで+45%、MCP Atlasで+28%の向上を実現しました。
  4. 全体的な効率の向上: 最大出力が65Kトークン、ファイル上限が100MBに拡大し、効率が15%向上しました。
  5. 3段階の思考システム: 「high」モードはDeep Think Miniと同等の性能を発揮。必要に応じて推論リソースを調整可能です。

今すぐ APIYI(apiyi.com)を通じて Gemini 3.1 Pro Preview を体験しましょう。統一されたインターフェースで即座に利用可能です。モデルパラメータを gemini-3.1-pro-preview に変更するだけで、アップグレードが完了します。


参考文献・リソース

  1. Google 公式ブログ: Gemini 3.1 Pro リリース告知
    • リンク: blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro
    • 説明: 公式の機能紹介とベンチマーク成績
  2. Google DeepMind モデルカード: Gemini 3.1 Pro 技術詳細
    • リンク: deepmind.google/models/model-cards/gemini-3-1-pro
    • 説明: 安全性評価と詳細なパラメータ
  3. Gemini API 公式ドキュメント: モデル一覧と呼び出し方法
    • リンク: ai.google.dev/gemini-api/docs/models/gemini-3.1-pro-preview
    • 説明: APIパラメータ、価格設定、使用ガイド
  4. VentureBeat 報道: Gemini 3.1 Pro 初回レビュー
    • リンク: venturebeat.com/technology/google-gemini-3-1-pro-first-impressions
    • 説明: Deep Think Miniの特性と実際の使用感
  5. MarkTechPost 分析: Gemini 3.1 Pro 技術解説
    • リンク: marktechpost.com/2026/02/19/google-ai-releases-gemini-3-1-pro
    • 説明: ベンチマークデータと業界への影響

📝 著者: APIYI チーム | 技術的な交流については APIYI(apiyi.com)をご覧ください
📅 更新日: 2026年2月20日
🏷️ キーワード: Gemini 3.1 Pro Preview API, APIYIリリース, 推論能力倍増, SWE-Bench 80.6%, ARC-AGI-2 77.1%

類似投稿