2026年5月19日、Googleは「Google I/O 2026」カンファレンスにおいて「Gemini 3.5 Flash」を正式発表しました。これはGemini 3.5シリーズ初の公開モデルであり、API IDにはgemini-3.5-flashが採用されています。previewサフィックスが付いていないことから、プレビュー版ではなく、すでにGA(一般提供開始)状態にあることがわかります。同日、APIYI(apiyi.com)プラットフォームでも対応が完了しており、開発者はOpenAI互換インターフェースを通じて、Gemini 3.5 Flashを自社製品に直接組み込むことが可能です。新規ユーザー登録で0.05米ドルの無料クレジットをプレゼントしており、コストをかけずに接続テストを行えます。

Gemini 3.5 Flashにおいて、開発者を最も驚かせたのは「FlashがProを上回る」という現象です。Terminal-Bench 2.1、MCP Atlas、Finance Agent v2、GDPval-AAなど、複数のエージェントおよびコーディングのベンチマークにおいて、実測スコアが前世代のフラッグシップモデルである「Gemini 3.1 Pro」を上回りました。さらに、出力速度は同クラスの最先端モデルと比較して約4倍に達すると公式発表されています。コーディングエージェントやツール呼び出しのワークフロー、長文ドキュメント処理を行うチームにとって、5月に最も評価すべきモデルアップデートと言えるでしょう。まずはAPIYI(apiyi.com)の無料クレジットを利用して、実際のタスクでテストを行い、本番環境のFlashモデルを3.5へ切り替えるかどうか検討することをおすすめします。
Gemini 3.5 Flashとは:Google正式版のコアポジショニング
Gemini 3.5 Flashは、Google DeepMindがGemini 3.5ファミリーの先陣を切ってリリースした軽量フラッグシップモデルであり、「Agentic Flash」として位置付けられています。Flashシリーズの低遅延・高スループットという特性を維持しつつ、前世代のProモデルにしかなかったツールオーケストレーションや多段階推論能力をFlashクラスにまで拡張しました。Googleは発表会で、3.5 Flashが現在最も強力なエージェントオーケストレーションモデルであり、Geminiアプリ、Google検索のAIモード、Google Antigravity、Google AI Studio、および企業向けクラウドに順次展開されると強調しました。
今回のリリースには、重要なポイントが4つあります。第一に、モデルIDにpreviewサフィックスがなく、内部バージョン番号が3.5-flash-05-2026であること。これは、プレビュー版のプロセスを経ず、最初からGAとして提供されることを意味します。第二に、「Dynamic Thinking(動的思考)」がデフォルトで有効化されており、モデルが問題に応じて思考プロセスを展開するかどうかを自動判断するため、開発者が手動で思考予算(thinking budget)を調整する必要がありません。第三に、ツール機能が標準装備されており、Function Calling、構造化出力、Search-as-a-Tool、コード実行などがすべて利用可能で、複雑なエージェントへの直接組み込みに適しています。第四に、知識のカットオフが2026年1月まで延長されており、現在の主要なクローズドソースモデルの中でも最新の知識ベースを備えています。
以下の表は、Gemini 3.5 Flashの主要スペックをまとめたものです。データはGoogle AI for Developersの公式ドキュメント、およびLLM-Stats、Artificial Analysisによる英語圏の実測データに基づいています。
| 項目 | Gemini 3.5 Flash 値 | 備考 |
|---|---|---|
| リリース日 | 2026年5月19日 | Google I/O 2026 基調講演 |
| モデルID | gemini-3.5-flash |
正式版、previewサフィックスなし |
| 内部バージョン | 3.5-flash-05-2026 |
Google AI Studioと一致 |
| 主なポジショニング | Agentic Flash · ツールオーケストレーション + コーディング | 複数のエージェント評価で3.1 Proを上回る |
| コンテキストウィンドウ | 1,048,576 入力トークン / 65,536 出力トークン | 1M / 64K |
| 入力モダリティ | テキスト + 画像 + 音声 + 動画 | 出力はテキストのみ |
| 動的思考 | デフォルトで有効 | 思考予算の手動設定不要 |
| ツール機能 | Function Calling / 構造化出力 / Search-as-a-Tool / コード実行 | 完全なエージェントツールスタック |
| 知識カットオフ | 2026年1月 | GPT-5.5、Claude Opus 4.7と同世代 |
| API接続 | OpenAI互換 / Geminiネイティブ | APIYI(apiyi.com)で両方の呼び出しに対応 |
🎯 接続のアドバイス: Gemini 3.5 Flashの最大の変更点は、「軽量モデル + ツール呼び出し」が標準能力になったことです。そのため、最も費用対効果の高い接続方法は、単なる置き換えではなく、エージェントワークフローの「ツールスケジューリング層」に配置することです。APIYI(apiyi.com)プラットフォームの統一インターフェースで0.05米ドルの無料クレジットを受け取り、既存のGPT-5.5 Instant / Claude Haiku 4.5 / Gemini 3.1 Flashのワークフローを
gemini-3.5-flashに切り替えて回帰テストを行い、本番環境への導入を判断することをおすすめします。
Gemini 3.5 Flash の価格とコンテキストウィンドウ仕様の概要
Gemini 3.5 Flash の価格設定は、今回のリリースにおける最大の議論の的となっています。Google は Flash シリーズの価格を、3 Flash Preview の $0.50 / $4 から 3.5 Flash では $1.50 / $9 へと引き上げました。これは Gemini 3.1 Pro の $2 / $12 に迫る価格帯です。Simon Willison 氏は自身のブログで、これは Google が「API 顧客の価格許容度をテストしている」と指摘しており、同時に 3.5 Flash の狙いが「より安くすること」ではなく、「Flash クラスのコストで Pro クラスの知能を提供すること」にあると分析しています。
以下の表では、Gemini 3.5 Flash の公式価格を同クラスの主要モデルと比較しています。ワークロードに対してコストパフォーマンスが優れているかどうかの判断にご活用ください。価格はすべて 100 万トークンあたりの米ドル表記です。
| モデル | 入力価格 | 出力価格 | キャッシュヒット入力 | コンテキストウィンドウ |
|---|---|---|---|---|
| Gemini 3.5 Flash | $1.50 | $9.00 | $0.15 | 1M / 64K 出力 |
| Gemini 3.1 Pro | $2.00 | $12.00 | $0.20 | 1M / 64K 出力 |
| Gemini 3.1 Flash-Lite | $0.25 | $1.50 | $0.025 | 1M / 64K 出力 |
| GPT-5.5(メインモデル) | $5.00 | $30.00 | $0.50 | 400K 入力 |
| Claude Opus 4.7(1M) | $15.00 | $75.00 | $1.50 | 1M 入力 |
比較のポイントは3つあります。第一に、同社の Gemini 3.1 Pro と比較して、Gemini 3.5 Flash は価格が 25% 安いにもかかわらず、コーディングやエージェントの評価ではより高い性能を発揮しています。Pro ユーザーにとっては明確な「値下げアップグレード」の機会と言えます。第二に、GPT-5.5 と比較すると、Gemini 3.5 Flash は 1 トークンあたりの価格が 3 分の 1 未満でありながら、Artificial Analysis Intelligence Index のスコア差はわずか 5 ポイントです。コストに敏感な対話型アプリケーションやエージェントのメインモデルとして最適です。第三に、Claude Opus 4.7 と比較しても、総合的な知能の差はわずか 2 ポイントですが、100 万トークンあたりの総コストは 10 分の 1 未満であり、極端に長いコンテキストを扱うシナリオでは大幅な予算削減が可能です。
💡 価格最適化のアドバイス: Gemini 3.5 Flash は $0.15 / 1M のキャッシュヒット入力価格を提供しており、長いシステムプロンプトや長文ドキュメントの RAG シナリオに適しています。APIYI (apiyi.com) プラットフォームでプロンプトキャッシングを有効にし、固定の指示、ナレッジベースの断片、長い会話履歴を再利用することで、100 万トークンの入力コストを 3.1 Flash-Lite と同レベルまでさらに抑えることができます。
Gemini 3.5 Flash の主要ベンチマーク:Gemini 3.1 Pro との実測比較
Gemini 3.5 Flash のリリースで最も直感に反するデータは、「Flash が Pro を上回った」という点です。Google 公式のモデルカードや LLM-Stats の実測データでも、エージェント、ツールオーケストレーション、コーディング、金融分析などのタスクにおいて、3.5 Flash のスコアが Gemini 3.1 Pro を上回っていることが確認されています。純粋な学術的推論(Humanity's Last Exam)や抽象的推論(ARC-AGI-2)においてのみ、3.1 Pro をわずかに下回る結果となりました。
以下の表は、Google 公式および第三者の公開評価から、Gemini 3.5 Flash と Gemini 3.1 Pro の主要なベンチマーク比較をまとめたものです。
| ベンチマーク | Gemini 3.5 Flash | Gemini 3.1 Pro | 差分 | 主な考察能力 |
|---|---|---|---|---|
| Terminal-Bench 2.1 | 76.2% | 70.3% | +5.9 | ターミナルコーディングエージェント |
| MCP Atlas | 83.6% | 78.2% | +5.4 | MCP ツール呼び出し |
| Finance Agent v2 | 57.9% | 43.0% | +14.9 | 金融ドキュメントエージェント |
| GDPval-AA(Elo) | 1656 | 1314 | +342 | 汎用エージェント総合 |
| CharXiv Reasoning | 84.2% | — | — | チャート推論 |
| Humanity's Last Exam | 40.2% | 44.4% | -4.2 | 純粋な学術推論 |
| ARC-AGI-2 | 72.1% | 77.1% | -5.0 | 抽象パターン推論 |
| 出力速度 | 約 284 token/s | 低速 | — | リアルタイム応答 |

このデータは、3 つの明確なシグナルを伝えています。第一に、Gemini 3.5 Flash の「追い越し」はツール呼び出しとエージェントタスクに集中しており、Finance Agent v2 での +14.9 や GDPval-AA での +342 Elo という差は非常に大きなものです。第二に、純粋な静的知識と抽象的推論は依然として Pro モデルの強みであり、数学コンテストや学術的推論、長鎖論理パズルを扱う場合は、Gemini 3.5 Flash が必ずしも最適解とは限りません。第三に、Google は今回 Flash モデルを用いて「モデル系統の再分担」を行っており、来月リリース予定とされる Gemini 3.5 Pro が、Pro クラスの天井をさらに引き上げることになるでしょう。
特に強調したいのは、Artificial Analysis Intelligence Index(総合知能指数)です。Gemini 3.5 Flash はこのベンチマーク合成指数で 55 ポイントを獲得し、Claude Opus 4.7 とはわずか 2 ポイント差、GPT-5.5 とは 5 ポイント差です。3.5 Flash の入力価格が Claude Opus 4.7 の 10 分の 1、GPT-5.5 の 3 分の 1 未満であることを考慮すると、これは現在最もコストパフォーマンスの高い「第一梯隊(トップ層)に近い」モデルの一つです。APIYI (apiyi.com) プラットフォーム上のデフォルトのエージェントモデルとして試用することをお勧めします。これにより、ベンダーを跨いだ運用負荷を大幅に軽減できるはずです。
Gemini 3.5 Flash 影響分析:開発者にとって何を意味するのか
今回のリリースは、単に選択肢が増えたというだけではありません。Google が「Flash + エージェント」という戦略において、GPT-5.5 や Claude Opus 4.7 に匹敵する総合力を備えたモデルを投入してきたことを意味します。これは、今後1〜2四半期の主要なワークフローを再構築する可能性を秘めています。

エージェント開発者への直接的な影響
エージェント開発チームにとって、Gemini 3.5 Flash は最も恩恵を受ける存在です。ベンチマークを見ると、「Terminal-Bench 2.1」と「MCP Atlas」の両方でのスコア向上は、「マルチステップのツール呼び出し + エラー復旧」という従来のボトルネックが改善されたことを意味します。「Finance Agent v2」での +14.9 という数値は、構造化されたドキュメント処理において明確な進歩があることを示しています。Shopify、Macquarie Bank、Salesforce、Ramp、Xero、Databricks といった海外企業がすでに Google の初期パートナーとして名を連ねており、データ分析、財務ドキュメント、企業自動化、請求書 OCR、税務ワークフロー、データセット監視といった領域をカバーしています。もしあなたの製品に「ドキュメントを読み取り → ツールを呼び出し → 構造化された結果を出力する」というワークフローがあるなら、Gemini 3.5 Flash は直ちに評価すべき最優先候補です。
長いコンテキスト RAG アプリケーションへの影響
Gemini 3.5 Flash は引き続き 1M トークンの入力と 64K トークンの出力ウィンドウを保持しています。さらに、入力キャッシュヒット時の価格が $0.15 / 1M トークンであるため、実質的に「百万トークン規模の長コンテキスト RAG」のコストを、コンシューマー向け SaaS でも許容できるレベルまで引き下げました。一般的な参考例として、50万トークンの固定知識ベース + 5万トークンのユーザー質問という構成であれば、キャッシュヒット後の推論コストは入力あたり 0.1 ドル未満となり、同様のコンテキストを GPT-5.5 や Claude Opus 4.7 に分割して渡すよりもはるかに低コストです。APIYI (apiyi.com) で長コンテキスト RAG のリンクを gemini-3.5-flash に統合し、キャッシュ戦略を既存の Gemini インターフェースで実装することをお勧めします。
マルチモデルルーティング戦略への影響
Gemini 3.5 Flash の登場により、主流のマルチモデルルーティング戦略は再設計が必要です。これまで一般的だった「会話は GPT、コードは Claude、マルチモーダルは Gemini」という分担は崩れました。Gemini 3.5 Flash がコーディングエージェント、ツール呼び出し、マルチモーダル入力のすべてにおいて競争力を備えているためです。まずは gemini-3.5-flash を新しい「汎用ツール層モデル」として採用し、特定のタスクの補強として GPT-5.5 Instant、Claude Opus 4.7、Gemini 3.1 Pro を残す構成を推奨します。APIYI (apiyi.com) の統一インターフェースを利用すれば、モデルのルーティング切り替えをゼロコストで実現可能です。
Gemini 3.5 Flash の APIYI での利用方法と無料トライアル
Gemini 3.5 Flash は APIYI (apiyi.com) プラットフォーム上で OpenAI と完全に互換性のある形式で利用でき、開発者は認証やルーティングロジックを再構築する必要はありません。新規ユーザー登録で 0.05 ドル分の試用クレジットが贈呈され、公式サンプルを試したり、エージェントワークフローの回帰テストを完了させたりするのに十分な額です。
シンプルな呼び出し例
from openai import OpenAI
# APIYIのクライアント設定
client = OpenAI(
api_key="YOUR_APIYI_KEY",
base_url="https://api.apiyi.com/v1",
)
response = client.chat.completions.create(
model="gemini-3.5-flash",
messages=[
{"role": "system", "content": "あなたはエージェントオーケストレーションエンジニアです。"},
{"role": "user", "content": "GitHub から issue を取得して週報を生成するツールチェーンを計画してください。"},
],
)
print(response.choices[0].message.content)
Function Calling を使用した完全な呼び出し例を表示
from openai import OpenAI
client = OpenAI(
api_key="YOUR_APIYI_KEY",
base_url="https://api.apiyi.com/v1",
)
tools = [
{
"type": "function",
"function": {
"name": "fetch_github_issues",
"description": "指定されたリポジトリの issue リストを取得する",
"parameters": {
"type": "object",
"properties": {
"repo": {"type": "string", "description": "オーナー名/リポジトリ名"},
"state": {"type": "string", "enum": ["open", "closed", "all"]},
},
"required": ["repo"],
},
},
}
]
response = client.chat.completions.create(
model="gemini-3.5-flash",
messages=[
{"role": "user", "content": "anthropics/anthropic-cookbook リポジトリで今週新しく作成された issue を確認して"},
],
tools=tools,
tool_choice="auto",
)
print(response.choices[0].message)
💡 試用のヒント: 0.05 ドルのクレジットは、Gemini 3.5 Flash の価格設定($1.50 / $9)に基づくと、約 3〜4 万トークンの入力または 5000 トークンの出力が可能です。これは、既存のプロンプトを APIYI (apiyi.com) 上で完全に再実行するのに十分な量です。公式サンプルを試すだけでなく、実際の業務タスクを無料枠で実行してみることをお勧めします。そうすることで、「Flash が Pro を上回ったか」をより正確に判断できるはずです。
3ステップで接続完了
- APIYI (apiyi.com) でアカウントを登録し、新規ユーザー認証を完了して 0.05 ドルの無料クレジットを受け取ります。
- コンソールで API キーを生成し、OpenAI SDK の
base_urlをhttps://api.apiyi.com/v1に変更し、modelフィールドにgemini-3.5-flashを入力します。 - 既存の GPT-5.5 Instant や Gemini 3.1 Pro Preview で使用していたプロンプトをそのまま流用し、応答品質、遅延、トークン消費量を比較してください。
Gemini 3.5 Flash よくある質問(FAQ)
Q1: Gemini 3.5 Flash と Gemini 3.1 Pro Preview、結局どちらが強力ですか?
用途によります。Terminal-Bench 2.1、MCP Atlas、Finance Agent v2、GDPval-AA などのエージェントタスクやコーディングタスクにおいては、Gemini 3.5 Flash の実測値が Gemini 3.1 Pro を上回っています。一方で、Humanity's Last Exam(純粋な学術的推論)や ARC-AGI-2(抽象的推論)では、3.1 Pro にわずかに及びません。結論として、エージェント開発、ツール呼び出し、コーディング、長文ドキュメントの RAG を行うチームは Gemini 3.5 Flash を優先的に選択すべきです。純粋な静的推論や学術的な評価を主な目的とするチームは、引き続き 3.1 Pro を利用しても良いでしょう。APIYI (apiyi.com) で無料枠を使って、一度回帰テストを行ってみることをおすすめします。
Q2: Gemini 3.5 Flash に「preview」という接尾辞がつかなくなったのはなぜですか?
これは Google が 3.5 シリーズでモデルのリリース戦略を変更したためです。3.5 Flash は直接 GA(一般提供)版としてリリースされており、モデル ID は gemini-3.5-flash、内部バージョンは 3.5-flash-05-2026 となっています。これは、完全なセキュリティ評価を通過し、本番環境レベルの SLA(サービス品質保証)を備えていることを意味します。前世代の Gemini 3.1 Pro Preview のような段階的なリリースとは異なり、開発者は preview 版が突然切り替わったり廃止されたりする心配をすることなく、安心して本番環境のコードに組み込むことができます。
Q3: 0.05 ドルの試用枠で、Gemini 3.5 Flash のリクエストはどれくらい実行できますか?
入力 100 万トークンあたり 1.50 ドル、出力 100 万トークンあたり 9 ドルの料金設定に基づくと、0.05 ドルで約 3 万トークンの入力と 1,500 トークンの出力が可能です。これは中程度の長さの対話で 30〜50 回の呼び出しに相当し、既存のプロンプトを APIYI (apiyi.com) 上で実際のタスクに適用して試すには十分な量です。プロンプトキャッシュ(prompt caching)を有効にすれば、キャッシュヒット部分は 100 万トークンあたり 0.15 ドルで計算されるため、無料枠をさらに長く活用できます。
Q4: Gemini 3.5 Flash は動画や音声の入力に対応していますか?
対応しています。Gemini 3.5 Flash の入力モダリティにはテキスト、画像、音声、動画が含まれます(出力はテキストのみ)。動画や音声はトークン化されて入力料金に加算される点にご注意ください。APIYI (apiyi.com) の接続インターフェースではこれらのモダリティパラメータが完全に公開されているため、既存の Gemini 3.x のマルチモーダル呼び出しコードをそのまま再利用可能です。
まとめ:Gemini 3.5 Flash は 5 月に最も評価すべきモデルのアップグレード
冒頭で触れた「直感に反する事実」に立ち返りましょう。Gemini 3.5 Flash は、エージェントやコーディングタスクにおいて前世代の Gemini 3.1 Pro を上回りました。それにもかかわらず、価格は Pro の 75% に抑えられ、知識のカットオフは 2026 年 1 月まで更新されており、出力速度は公式測定で同クラスの最先端モデルの 4 倍に達します。エージェントの実行、ツール呼び出し、長文ドキュメントの RAG、企業の自動化ワークフローに取り組むチームにとって、これは 2026 年上半期で最も優先的に評価すべき Google のモデルアップグレードです。
Gemini 3.5 Flash は現在、APIYI (apiyi.com) プラットフォームで利用可能です。新規登録で 0.05 ドルの無料枠がプレゼントされるため、コストゼロで接続テストを完了できます。エージェントワークフローのツールスケジューリング層に優先的に組み込み、APIYI (apiyi.com) の OpenAI 互換インターフェースを通じて接続することをおすすめします。これにより、Google の最新モデルの恩恵を直接受けながら、Claude Opus 4.7、GPT-5.5 Instant、Gemini 3.1 Pro などのモデル間で柔軟にルーティングを行うことが可能です。
著者: APIYI 技術チーム · apiyi.com
公開日: 2026 年 5 月 20 日
参考資料: Google AI for Developers、LLM-Stats、Artificial Analysis、Simon Willison Blog、Interesting Engineering、9to5Google
