|

Gemini 3.5 Flash 対 Gemini 3.1 Pro Preview 全方位比較:本当に価格据え置きで性能向上したのか?8つの次元で徹底検証

2026年5月19日にGemini 3.5 Flashがリリースされた際、開発者コミュニティで最も議論されたのは「使えるかどうか」ではなく、「昨年後半から稼働しているGemini 3.1 Pro Previewを直接置き換えられるか」という点でした。Google公式は、3.5 Flashがコーディング、ツール呼び出し、エージェントタスクにおいて「すでに3.1 Proを超えている」と繰り返し強調しています。価格面でも3.5 Flashは1.50ドル/9ドルと、Proの2ドル/12ドルより25%安く、まさに「実質値下げ」のように聞こえます。しかし、BenchLMの総合ランキングでは3.1 Proが92点、3.5 Flashが87点と、3.1 Proが5ポイント上回っています。一体どちらを信じるべきでしょうか?本記事では、Google、LLM-Stats、Artificial Analysis、Engadget、DataCampなどの一次情報を基に、8つの側面から徹底比較します。

gemini-3-5-flash-vs-3-1-pro-preview-comparison-ja 图示

結論から申し上げます。エージェントワークフロー、コーディングCopilot、長文ドキュメント処理を行うチームにとって、Gemini 3.5 Flashは「実質値下げ」であり、より安価なコストでより強力なエージェント性能を享受できます。一方で、学術的な推論、抽象的な論理思考、200K以上の超長文コンテキストを扱うチームにとっては、Gemini 3.1 Pro Previewが依然として代替不可能な高いパフォーマンスを発揮します。まずはAPIYI(apiyi.com)の無料枠を利用して、実際の業務で両モデルを試してから、本番環境での使い分けを検討することをお勧めします。

Gemini 3.5 Flash vs Gemini 3.1 Pro Preview 核心的な違い

両モデルはGemini 3.xファミリーに属していますが、位置付けは全く異なります。Gemini 3.5 Flashは、Googleが2026年5月19日にGA(一般提供)した「エージェント型Flash」であり、プレビュー版ではない正式版としてリリースされました(モデルID:gemini-3.5-flash)。一方、Gemini 3.1 Pro Previewは2025年末にプレビュー版として登場したフラッグシップ推論モデル(モデルID:gemini-3.1-pro-preview)であり、学術推論や高難易度な問題解決に特化しています。現在もプレビュー状態であるため、SLA(サービス品質保証)はGA版ほど安定していません。

以下の表は、Google AI for DevelopersおよびLLM-Statsの英語実測ページに基づいた、両モデルの主要スペック比較です。

比較項目 Gemini 3.5 Flash Gemini 3.1 Pro Preview 勝者
リリース状態 GA(正式版) Preview(プレビュー版) 3.5 Flash
モデルID gemini-3.5-flash gemini-3.1-pro-preview
コンテキストウィンドウ 1,048,576入力 / 65,536出力 1,048,576入力 / 65,536出力 引き分け
入力モダリティ テキスト+画像+音声+動画 テキスト+画像+音声+動画+コード 3.1 Pro
知識のカットオフ 2026年1月 2025年末 3.5 Flash
動的思考 デフォルト有効、設定不要 手動で思考予算の設定が必要 3.5 Flash
ツール能力 関数呼び出し / 検索ツール / コード実行 関数呼び出し / 検索ツール / コード実行 引き分け
出力速度 約289トークン/秒(公式:同等モデルの4倍) 低速、通常60-90トークン/秒 3.5 Flash
APIYI接続 対応済み、新規ユーザーに0.05ドル付与 対応済み、新規ユーザーに0.05ドル付与 引き分け

🎯 接続のヒント: Gemini 3.5 FlashとGemini 3.1 Pro Previewは、どちらもAPIYI(apiyi.com)プラットフォームで利用可能です。OpenAI互換インターフェースを使用すれば、認証やルーティングロジックを書き換えることなく、modelフィールドを gemini-3.5-flashgemini-3.1-pro-preview に書き換えるだけで、コストゼロでモデルを切り替えることができます。

「増量しても価格はそのまま」の真相:価格面での実測分析

本稿の核心的な問いに戻りましょう。Gemini 3.5 Flash は本当に「増量しても価格はそのまま」なのでしょうか?この問いに答えるには、公式価格、キャッシュヒット時の価格、超長文コンテキストの段階的価格、そして総合的なインテリジェンススコアの4つの側面を統合して見る必要があります。

gemini-3-5-flash-vs-3-1-pro-preview-comparison-ja 图示

以下の表は、両モデルの完全な価格構造の比較です。すべての価格は100万トークンあたりの米ドル単価です。

価格項目 Gemini 3.5 Flash Gemini 3.1 Pro Preview 差異
標準入力(<200K) $1.50 $2.00 25%安
標準出力(<200K) $9.00 $12.00 25%安
超長文入力(>200K) $1.50(段階なし) $4.00 62.5%安
超長文出力(>200K) $9.00(段階なし) $18.00 50%安
キャッシュヒット入力 $0.15 $0.20 25%安
キャッシュ書き込み 無料(暗黙的キャッシュ) $0.38 圧倒的に安価

この比較から3つの重要な事実がわかります。第一に、標準的なコンテキスト範囲(200Kトークン未満)において、3.5 Flashは3.1 Pro Previewよりも全体で25%安く、実質的に常時25%オフの割引が適用されているのと同等です。第二に、超長文コンテキスト範囲はまさに「コスト削減の要」です。3.1 Pro Previewは200Kトークンを超えると段階的な値上げが発生し、入力は2倍の$4/1M、出力は$18/1Mに跳ね上がりますが、3.5 Flashは全域でフラットな価格設定です。長文ドキュメントのRAGや数百万トークン規模のコンテキストを扱うエージェントでは、実際のコスト差は50〜62.5%にまで広がります。第三に、キャッシュヒット時の入力価格が$0.15と3.1 Proの$0.20より25%安く、さらにキャッシュ書き込みが無料であるため、「長いシステムプロンプト+多回数対話」のようなシナリオでは、実質コストを3.1 Proの3分の1以下に抑えることが可能です。

💡 コスト試算のアドバイス:ワークロードの平均コンテキストが200K未満であれば、3.5 Flashを選択するだけで25%のコスト削減になります。コンテキストが頻繁に200Kを超える場合(コードベースのスキャン、長い論文の分析、企業知識ベースのRAGなど)、3.5 Flashは3.1 Proと比較して、浮いた予算でさらに2倍の呼び出し回数を確保できる可能性があります。APIYI (apiyi.com) で1週間実際のトラフィックを流し、最終的なモデルルーティングを決定することをお勧めします。

Gemini 3.5 Flash vs 3.1 Pro ベンチマーク比較:Flashが逆転する真の領域

価格が安くても、性能が伴わなければ意味がありません。Google公式およびLLM-Statsが公開した比較データによると、Gemini 3.5 Flashはエージェント、ツール呼び出し、コーディングタスクにおいてGemini 3.1 Proを確実に上回っていますが、純粋な学術的推論や抽象的推論においては依然として後塵を拝しています。以下の表は、代表的な8つのベンチマーク結果をまとめたものです。

ベンチマーク Gemini 3.5 Flash Gemini 3.1 Pro Preview 勝者 主な評価能力
Terminal-Bench 2.1 76.2% 70.3% 3.5 Flash ターミナルコーディングエージェント
MCP Atlas 83.6% 78.2% 3.5 Flash MCPツール呼び出し
Finance Agent v2 57.9% 43.0% 3.5 Flash 金融ドキュメントエージェント
GDPval-AA(Elo) 1656 1314 3.5 Flash 汎用エージェント総合
CharXiv Reasoning 84.2% 低い 3.5 Flash グラフ推論
Humanity's Last Exam 40.2% 44.4% 3.1 Pro 純粋な学術推論
ARC-AGI-2 72.1% 77.1% 3.1 Pro 抽象パターン推論
AA Intelligence Index 55 57 3.1 Pro(+2) 総合インテリジェンス

この表の正しい読み方は、2つのグループに分けて見ることです。第一グループはエージェントおよびツールタスクで、Gemini 3.5 Flashが全面的に逆転しています。Finance Agent v2では+14.9ポイント、GDPval-AAのEloスコアでは342ポイントの差をつけており、マルチステップのツール実行、エラー復旧、構造化ドキュメント処理において世代を超えた進化を遂げていることを示しています。第二グループは純粋な認知タスクで、Gemini 3.1 Pro Previewが依然として優位を保っています。ARC-AGI-2で5ポイント、Humanity's Last Examで4.2ポイント、Artificial Analysisの総合インテリジェンス指数で2ポイント上回っています。

BenchLMの総合ランキングデータについても触れておきます。彼らの比較では、Gemini 3.1 Proが合計92点、Gemini 3.5 Flashが87点と5点の差がありますが、この差は主にProの推論能力(77.1 vs 74.7)と知識量によるもので、Flashのエージェント能力やコーディング能力の高さによって一部相殺されています。一言で言えば、エージェントワークフローに近づくほどFlashが有利になり、静的なQ&Aに近づくほどProが有利になるということです。この違いが選定の指針となります。APIYI (apiyi.com) の統合インターフェースを通じて、具体的なタスクにおける両者の真の性能差を低コストで検証してみてください。

シーン別推奨:Gemini 3.5 Flashと3.1 Proの使い分け

8つの指標による比較を、そのまま実行可能な選定ガイドラインに落とし込みました。以下の推奨表は、唯一の正解を示すものではなく、各ビジネスシーンにおいてどちらがより優れた選択肢かを判断するためのヒントです。

シーン 推奨モデル 主な理由
コード Copilot / IDE プログラミング支援 Gemini 3.5 Flash Terminal-Bench 2.1で5.9ポイント向上、速度は4倍
エージェントによる複数ステップのツール呼び出し Gemini 3.5 Flash MCP Atlas / GDPval-AAで明確な優位性
長文ドキュメントRAG(50K-1Mトークン) Gemini 3.5 Flash 標準トークン単価が安く、キャッシュ書き込みが無料
金融/法律/財務ドキュメント処理 Gemini 3.5 Flash Finance Agent v2で14.9ポイント向上
数学コンテストやAIMEレベルの推論 Gemini 3.1 Pro Preview 学術的な推論能力でリード
ARC-AGI 抽象推論 Gemini 3.1 Pro Preview 5ポイントの差で優位
超長文の論文/書籍の単一分析 Gemini 3.1 Pro Preview 長いコンテキストでの高密度推論に強み
汎用チャットボット Gemini 3.5 Flash コストと速度のバランスが最適
企業向け自動化ワークフロー Gemini 3.1 Pro Preview Shopify/Salesforce/Databricksでの実証済み
マルチモデルルーティングの「汎用ツール層」 Gemini 3.5 Flash 総合的なコストパフォーマンスが最高

実務において最も理想的な戦略は「二者択一」ではなく「タスクに応じたルーティング」です。Gemini 3.5 Flashを標準のエージェントおよびコーディングの主力として設定し、Gemini 3.1 Pro Previewを難易度の高い推論タスク用のフォールバックモデルとして残しておくことを推奨します。APIYI (apiyi.com) の統一インターフェースを利用すれば、同一の認証キーでモデルを切り替えることが可能です。これにより、3.5 Flashのコストメリットを享受しつつ、難易度の高いシーンでは推論能力の上限を維持できます。

gemini-3-5-flash-vs-3-1-pro-preview-comparison-ja 图示

Gemini 3.5 Flash を選ぶべき典型的なシーン

「ドキュメントを読み込み → ツールを呼び出し → 構造化データを出力する」というワークフローを製品に組み込む場合、Gemini 3.5 Flashは現在最高の選択肢です。Engadgetの報道によると、GoogleはすでにShopify(データ分析)、Macquarie Bank(財務ドキュメント)、Salesforce(企業自動化)、Ramp(請求書OCR)、Xero(税務ワークフロー)、Databricks(データセット監視)といった企業の本番環境に導入しており、その適用範囲は非常に広範です。APIYI (apiyi.com) のOpenAI互換インターフェースを活用すれば、移行コストはほぼゼロです。

Gemini 3.1 Pro Preview を推奨する典型的なシーン

「Humanity's Last Exam」のような難度の高い推論、ARC-AGIのような抽象的なパターン認識、あるいは長大な数学的証明がコアタスクである場合、Gemini 3.1 Pro Previewは依然として+2〜+5ポイントの安定した優位性を持っています。こうしたシーンではコストよりも、モデルが発揮できる推論の「天井」が重要です。6月に予定されているGemini 3.5 Proの正式リリースまでは、引き続きAPIYI (apiyi.com) で gemini-3.1-pro-preview を呼び出してこれらのタスクを実行することをお勧めします。

意思決定のヒントと Gemini 3.5 Flash / 3.1 Pro Preview の接続方法

本記事のタイトルにある「増量しても価格はそのままか?」という核心的な問いに対し、私たちの結論はこうです。「実務の70%以上において、答えは『イエス』です」。3.5 Flash を使えば、より低コストでより強力なエージェントの知能を手に入れることができます。ただし、残りの30%を占める難解な推論や抽象的な推論タスクについては、3.1 Pro Preview の高いスコア領域を維持する価値が依然としてあります。最も安全な接続戦略は二者択一ではなく、両方のモデルをワークフローに組み込み、ルーティング(振り分け)を行うことです。

以下に、APIYI(apiyi.com)上で Gemini 3.5 Flash と Gemini 3.1 Pro Preview を同時に呼び出すための最もシンプルな Python の実装例を示します。OpenAI 互換の記述形式をそのまま維持しています。

from openai import OpenAI

# APIYIのクライアント設定
client = OpenAI(
    api_key="YOUR_APIYI_KEY",
    base_url="https://api.apiyi.com/v1",
)

def call_gemini(model_id: str, prompt: str) -> str:
    resp = client.chat.completions.create(
        model=model_id,
        messages=[{"role": "user", "content": prompt}],
    )
    return resp.choices[0].message.content

# 各モデルの呼び出し
flash_answer = call_gemini("gemini-3.5-flash", "GitHub PR週報作成エージェントの計画を3ステップで立てて")
pro_answer = call_gemini("gemini-3.1-pro-preview", "任意の自然数 n に対して、n^3 - n が 6 で割り切れることを証明せよ")
print("Flash:", flash_answer)
print("Pro Preview:", pro_answer)
ルーティング戦略を含む完全な実装を見る
from openai import OpenAI

client = OpenAI(
    api_key="YOUR_APIYI_KEY",
    base_url="https://api.apiyi.com/v1",
)

# ルーティング用のキーワード設定
AGENT_KEYWORDS = ("tool", "function", "agent", "コード", "ツール", "呼び出し", "ワークフロー")
REASONING_KEYWORDS = ("証明", "導出", "ARC", "AIME", "数学コンテスト", "olymp")

def route_model(task_prompt: str) -> str:
    lower = task_prompt.lower()
    if any(k in lower for k in REASONING_KEYWORDS):
        return "gemini-3.1-pro-preview"
    if any(k in task_prompt for k in AGENT_KEYWORDS):
        return "gemini-3.5-flash"
    return "gemini-3.5-flash"

def smart_call(prompt: str) -> dict:
    model = route_model(prompt)
    resp = client.chat.completions.create(
        model=model,
        messages=[{"role": "user", "content": prompt}],
    )
    return {
        "model": model,
        "content": resp.choices[0].message.content,
        "usage": resp.usage.model_dump() if resp.usage else None,
    }

if __name__ == "__main__":
    print(smart_call("今週マージされたPRを取得するGitHub API呼び出しエージェントを書いて"))
    print(smart_call("ARC-AGI 第42問の解空間が8種類以下であることを証明して"))

💡 試用のアドバイス: APIYI(apiyi.com)では、新規登録時に0.05ドルの無料クレジットをプレゼントしています。Gemini 3.5 Flashの価格(1.50ドル/9ドル)なら中程度の長さの呼び出しを30〜50回、Gemini 3.1 Pro Previewの価格(2ドル/12ドル)なら20〜30回試すことが可能です。まずは無料クレジットを使って、実際のタスクで両モデルを比較し、出力品質と遅延の差を確認してから、本番環境での振り分け比率を決定することをお勧めします。

Gemini 3.5 Flash vs 3.1 Pro Preview よくある質問(FAQ)

Q1: Gemini 3.5 Flash は Gemini 3.1 Pro Preview を完全に代替できますか?

100%の代替はできませんが、70%以上の業務シナリオでは十分です。エージェント、ツール呼び出し、コーディング、長文ドキュメント処理においては 3.5 Flash の方が高性能かつ低コストです。しかし、「Humanity's Last Exam」や「ARC-AGI-2」、複雑な数学的推論などのタスクでは、依然として 3.1 Pro Preview が2〜5ポイント上回ります。APIYI(apiyi.com)上で両方のモデルをマウントし、プロンプトのキーワードやタスクの種類に応じて、エージェント系は Flash、難解な推論系は Pro といったルーティングを行うことを推奨します。

Q2: なぜ Gemini 3.5 Flash は「増量しても価格はそのまま」と言えるのですか?

「増量」の根拠は主に3点です。第一に、エージェントやコーディングのベンチマークで 3.1 Pro を全面的に上回っており(Terminal-Bench 2.1で5.9ポイント増、MCP Atlasで5.4ポイント増、Finance Agent v2で14.9ポイント増)、第二に知識のカットオフ時期が2025年末から2026年1月に延長されました。第三に、動的思考(Dynamic Thinking)がデフォルトで有効化されており、手動での思考予算設定が不要です。価格については、標準セグメントで 3.1 Pro の2ドル/12ドルに対し、1.50ドル/9ドルと25%安くなっており、200Kコンテキストを超えると価格差は50〜62%にまで広がります。

Q3: Gemini 3.1 Pro Preview はいつまでメンテナンスされますか?今すぐ移行すべきですか?

Google から明確な終了日は発表されていませんが、海外の情報によると Gemini 3.5 Pro が2026年6月にリリース予定であり、その時点で 3.1 Pro Preview はメンテナンスモードに移行する可能性が高いです。今すぐ 3.1 Pro Preview を完全に停止する必要はありませんが、「難解な推論用のフォールバックモデル」として位置づけ、メインのトラフィックは 3.5 Flash に切り替えることをお勧めします。APIYI(apiyi.com)プラットフォームでは Gemini モデルのライフサイクルを継続的に追跡しており、3.1 Pro Preview が廃止対象となる前に事前警告を行います。

Q4: Gemini 3.5 Flash と Gemini 3.1 Pro でマルチモーダル入力に違いはありますか?

大きな違いはありません。両モデルともテキスト、画像、音声、動画の入力をサポートしています。Gemini 3.1 Pro Preview はドキュメント上で「コード」を独立したモダリティとして明示していますが、実際のパフォーマンスとしては、より長いコードブロック処理がわずかに安定している程度です。もし主なタスクが「画像読み取り+ツール呼び出し」であれば、処理速度が4倍速く、動的思考もサポートしている Gemini 3.5 Flash を優先してください。単一のターンで超巨大なコードベースを処理する必要がある場合にのみ、Gemini 3.1 Pro Preview に切り替えるのが賢明です。いずれも APIYI(apiyi.com)プラットフォームを通じてワンクリックで切り替え可能です。

まとめ:Gemini 3.5 Flash と 3.1 Pro Preview のベストパートナー関係

「価格は据え置きで性能アップか?」という核心的な問いに戻りましょう。価格面で見ると、Gemini 3.5 Flash は標準セグメントで25%安く、超長コンテキストセグメントでは最大62.5%も安価です。さらにキャッシュヒット時の価格も25%削減されており、間違いなく「価格据え置き(あるいは値下げ)」と言えます。能力面では、エージェント機能やコーディング能力で 3.1 Pro を上回りましたが、学術的推論や抽象的推論では依然として2〜5ポイントの差があり、「70%のシーンで性能向上、30%のシーンでわずかに譲る」という結果です。

最も現実的な結論は、これら2つのモデルを「競合関係」ではなく「パートナー関係」として捉えることです。日常的なエージェントタスクやコーディングの主力として Gemini 3.5 Flash を使い、高度な推論が必要な場面で Gemini 3.1 Pro Preview にフォールバックさせる。APIYI(apiyi.com)の OpenAI 互換インターフェースを利用すれば、ルーティングの切り替えもスムーズに行えます。新規ユーザー登録時には0.05ドルの無料クレジットがプレゼントされるため、コストゼロで両モデルを比較検証し、自身のワークフローに最適な配分を決めることができます。


著者: APIYI 技術チーム · apiyi.com
公開日: 2026年5月20日
参考資料: Google AI for Developers、Google DeepMind Model Card、LLM-Stats、Artificial Analysis、Engadget、DataCamp、BenchLM、OfficeChai

類似投稿