19 мая 2026 года на конференции Google I/O 2026 компания Google официально представила Gemini 3.5 Flash. Это первая модель из семейства Gemini 3.5, доступная широкой публике. API-идентификатор модели — gemini-3.5-flash, без суффикса «preview», что означает её статус GA (General Availability), то есть полноценный релиз, а не тестовая версия. В тот же день платформа APIYI (apiyi.com) завершила интеграцию, и теперь разработчики могут использовать Gemini 3.5 Flash в своих продуктах через совместимый с OpenAI интерфейс. Новые пользователи получают 0,05 доллара на баланс при регистрации, что позволяет протестировать модель бесплатно.

Больше всего разработчиков удивил феномен «Flash обходит Pro»: в тестах Terminal-Bench 2.1, MCP Atlas, Finance Agent v2, GDPval-AA и других бенчмарках для агентов модель показала результаты выше, чем у флагмана предыдущего поколения Gemini 3.1 Pro. При этом скорость вывода, по официальным данным, примерно в 4 раза выше, чем у аналогичных моделей этого класса. Для команд, работающих с кодинг-агентами, рабочими процессами вызова инструментов и обработкой длинных документов, это самое важное обновление мая. Рекомендуем сначала протестировать свои реальные задачи с помощью бесплатного лимита на APIYI (apiyi.com), прежде чем переключать продакшн-решения с Flash на версию 3.5.
Что такое Gemini 3.5 Flash: позиционирование официальной версии от Google
Gemini 3.5 Flash — это легкая флагманская модель из семейства Gemini 3.5 от Google DeepMind, позиционируемая как «Agentic Flash». Она сохраняет низкую задержку и высокую пропускную способность, свойственные серии Flash, но при этом получила возможности управления инструментами и многошагового рассуждения, которые раньше были доступны только в моделях Pro. На презентации Google подчеркнула, что 3.5 Flash — их самая мощная модель для агентской оркестрации, которая уже развернута в приложениях Gemini, AI Mode в Google Search, Google Antigravity, Google AI Studio и облачных корпоративных сервисах.
В этом релизе есть четыре ключевых момента. Во-первых, у модели нет суффикса «preview», а внутренний номер версии — 3.5-flash-05-2026, что означает готовность к промышленному использованию. Во-вторых, по умолчанию включена функция Dynamic Thinking (динамическое мышление): модель сама определяет, нужно ли ей разворачивать цепочку рассуждений, и разработчикам не нужно вручную настраивать «бюджет мышления». В-третьих, доступны все инструменты: вызов функций (function calling), структурированный вывод, поиск как инструмент (Search-as-a-Tool) и выполнение кода (Code Execution). В-четвертых, база знаний актуальна по январь 2026 года, что делает её одной из самых свежих среди популярных закрытых моделей.
В таблице ниже собраны основные характеристики Gemini 3.5 Flash, основанные на официальной документации Google AI for Developers и данных тестов LLM-Stats и Artificial Analysis.
| Параметр | Значение Gemini 3.5 Flash | Примечание |
|---|---|---|
| Дата выпуска | 19 мая 2026 г. | Презентация Google I/O 2026 |
| ID модели | gemini-3.5-flash |
Официальная версия, без суффикса preview |
| Внутренняя версия | 3.5-flash-05-2026 |
Соответствует Google AI Studio |
| Позиционирование | Agentic Flash · Оркестрация инструментов + кодинг | Обходит 3.1 Pro в тестах агентов |
| Контекстное окно | 1 048 576 входных / 65 536 выходных токенов | 1 млн / 64 тыс. |
| Входные модальности | Текст + изображение + аудио + видео | Вывод только текст |
| Динамическое мышление | Включено по умолчанию | Не требуется настройка бюджета |
| Инструменты | Function calling / Структурированный вывод / Search-as-a-Tool / Code Execution | Полный стек для агентов |
| Актуальность знаний | Январь 2026 г. | На уровне GPT-5.5, Claude Opus 4.7 |
| Доступ к API | Совместимость с OpenAI / Нативный Gemini | APIYI (apiyi.com) поддерживает оба способа |
🎯 Совет по интеграции: Главное изменение в Gemini 3.5 Flash — это превращение «легкой модели с вызовом инструментов» в стандартную возможность. Поэтому наиболее эффективный способ — использовать её как «уровень управления инструментами» в агентском рабочем процессе. Мы рекомендуем получить бесплатные 0,05 доллара на платформе APIYI (apiyi.com), прогнать ваши текущие рабочие процессы (GPT-5.5 Instant / Claude Haiku 4.5 / Gemini 3.1 Flash) через
gemini-3.5-flashдля регрессионного тестирования, а затем принимать решение о внедрении в продакшн.
Краткий обзор цен и контекстного окна Gemini 3.5 Flash
Ценообразование Gemini 3.5 Flash стало еще одним поводом для жарких дискуссий после релиза. Google подняла цены на серию Flash: с $0.50 / $4 для 3 Flash Preview до $1.50 / $9 для 3.5 Flash, что уже приближается к уровню Gemini 3.1 Pro ($2 / $12). Саймон Уиллисон в англоязычном сообществе предположил, что Google «тестирует ценовую терпимость API-клиентов». Это также означает, что цель 3.5 Flash — не стать дешевле, а предложить интеллект уровня Pro по стоимости линейки Flash.
В таблице ниже мы сравнили официальные цены Gemini 3.5 Flash с актуальными моделями того же класса, чтобы вы могли оценить выгоду для своих задач. Все цены указаны за 1 млн токенов.
| Модель | Цена на вход | Цена на выход | Кэшированный вход | Контекстное окно |
|---|---|---|---|---|
| Gemini 3.5 Flash | $1.50 | $9.00 | $0.15 | 1M / 64K выход |
| Gemini 3.1 Pro | $2.00 | $12.00 | $0.20 | 1M / 64K выход |
| Gemini 3.1 Flash-Lite | $0.25 | $1.50 | $0.025 | 1M / 64K выход |
| GPT-5.5 (основная) | $5.00 | $30.00 | $0.50 | 400K вход |
| Claude Opus 4.7 (1M) | $15.00 | $75.00 | $1.50 | 1M вход |
Обратите внимание на три ключевых момента. Во-первых, по сравнению с Gemini 3.1 Pro, Gemini 3.5 Flash дешевле на 25%, но при этом показывает лучшие результаты в кодинге и агентских задачах — для пользователей Pro это отличный шанс «апгрейднуться с экономией». Во-вторых, по сравнению с GPT-5.5, цена за токен у Gemini 3.5 Flash почти в три раза ниже, а разрыв в индексе Artificial Analysis Intelligence Index составляет всего 5 баллов, что делает её идеальной для чувствительных к бюджету диалоговых систем и агентов. В-третьих, по сравнению с Claude Opus 4.7, при разнице в интеллекте всего в 2 балла, стоимость 3.5 Flash в десять раз ниже, что позволяет существенно сэкономить бюджет при работе с экстремально длинным контекстом.
💡 Совет по оптимизации затрат: Gemini 3.5 Flash предлагает цену $0.15 / 1M для кэшированных входных данных, что идеально подходит для длинных системных промптов и RAG-сценариев с большими документами. Рекомендуем включить prompt caching на платформе APIYI (apiyi.com), чтобы повторно использовать фиксированные инструкции, фрагменты базы знаний и историю длинных диалогов. Это позволит снизить стоимость 1M токенов на входе до уровня 3.1 Flash-Lite.
Ключевые бенчмарки Gemini 3.5 Flash: сравнение с Gemini 3.1 Pro
Самый контринтуитивный факт релиза — «Flash обошел Pro». Официальные данные Google и независимые тесты LLM-Stats подтверждают: в задачах на работу с агентами, оркестрацию инструментов, кодинг и финансовый анализ 3.5 Flash превосходит Gemini 3.1 Pro. Уступает он лишь в чисто академических рассуждениях (Humanity's Last Exam) и абстрактной логике (ARC-AGI-2).
Ниже приведена сводная таблица ключевых бенчмарков:
| Бенчмарк | Gemini 3.5 Flash | Gemini 3.1 Pro | Разница | Навык |
|---|---|---|---|---|
| Terminal-Bench 2.1 | 76.2% | 70.3% | +5.9 | Агент кодинга в терминале |
| MCP Atlas | 83.6% | 78.2% | +5.4 | Вызов инструментов MCP |
| Finance Agent v2 | 57.9% | 43.0% | +14.9 | Агент фин. документации |
| GDPval-AA (Elo) | 1656 | 1314 | +342 | Общий агентский интеллект |
| CharXiv Reasoning | 84.2% | — | — | Анализ графиков |
| Humanity's Last Exam | 40.2% | 44.4% | -4.2 | Академические рассуждения |
| ARC-AGI-2 | 72.1% | 77.1% | -5.0 | Абстрактная логика |
| Скорость вывода | ~284 токена/с | медленнее | — | Реакция в реальном времени |

Эти данные говорят о трех вещах. Во-первых, преимущество Gemini 3.5 Flash сосредоточено в задачах на вызов инструментов и работу агентов. Во-вторых, статические знания и абстрактная логика остаются сильной стороной Pro-моделей — если ваша нагрузка связана с математикой или академическими задачами, 3.5 Flash может быть не лучшим выбором. В-третьих, Google фактически провела «перераспределение ролей» в линейке моделей; по слухам, Gemini 3.5 Pro выйдет в следующем месяце и поднимет планку возможностей еще выше.
Отдельно стоит отметить Artificial Analysis Intelligence Index. Gemini 3.5 Flash набрала 55 баллов, уступив Claude Opus 4.7 всего 2 балла, а GPT-5.5 — 5 баллов. Учитывая, что стоимость входа у 3.5 Flash в десять раз ниже, чем у Opus, и в три раза ниже, чем у GPT-5.5, это одна из самых выгодных моделей «первого эшелона». Рекомендуем попробовать её в качестве модели по умолчанию для агентов на платформе APIYI (apiyi.com), чтобы снизить нагрузку на поддержку инфраструктуры при работе с разными вендорами.
Анализ влияния Gemini 3.5 Flash: что это значит для разработчиков
Этот релиз — не просто появление очередной модели в списке доступных. Google представила комплексное решение в рамках стратегии «Flash + Агент», которое способно конкурировать с GPT-5.5 и Claude Opus 4.7. Это событие переформатирует несколько ключевых рабочих процессов в ближайшие 1–2 квартала.

Прямое влияние на разработчиков агентов
Команды, работающие над агентами, — главные бенефициары Gemini 3.5 Flash. Судя по бенчмаркам, рост показателей в Terminal-Bench 2.1 и MCP Atlas означает, что традиционные «узкие места» в виде многошагового вызова инструментов и восстановления после ошибок наконец-то сгладились. Улучшение на 14,9 пункта в Finance Agent v2 говорит о значительном прогрессе в обработке структурированных документов. Такие компании, как Shopify, Macquarie Bank, Salesforce, Ramp, Xero и Databricks, уже стали первыми партнерами Google, применяя модель в анализе данных, работе с финансовой документацией, автоматизации бизнес-процессов, OCR счетов и налоговых потоках. Если в вашем продукте есть цепочка «чтение документа → вызов инструмента → вывод структурированного результата», Gemini 3.5 Flash — кандидат, которого стоит оценить прямо сейчас.
Влияние на RAG-приложения с длинным контекстом
Gemini 3.5 Flash сохраняет окно в 1 млн токенов на вход и 64 тыс. на выход. В сочетании с ценой кэширования входных данных $0.15 / 1 млн токенов, это делает «RAG с миллионным контекстом» доступным для обычных SaaS-решений. Для справки: фиксированная база знаний на 500 тыс. токенов + 50 тыс. токенов на вопрос пользователя при использовании кэширования обойдутся менее чем в 0,1 доллара за один вывод. Это значительно дешевле, чем разбивать тот же контекст для GPT-5.5 или Claude Opus 4.7. Рекомендуем перевести цепочки RAG с длинным контекстом на gemini-3.5-flash через APIYI (apiyi.com) — стратегии кэширования можно реализовать, используя существующие интерфейсы Gemini.
Влияние на стратегии маршрутизации моделей
После запуска Gemini 3.5 Flash привычные стратегии маршрутизации требуют пересмотра. Старое разделение «GPT для диалогов, Claude для кода, Gemini для мультимодальности» больше не актуально, так как Gemini 3.5 Flash конкурентоспособен во всех трех направлениях: кодинг-агенты, вызов инструментов и мультимодальный ввод. Мы предлагаем сделать gemini-3.5-flash новой «базовой моделью для инструментов», а GPT-5.5 Instant, Claude Opus 4.7 и Gemini 3.1 Pro оставить для специфических задач. Благодаря единому интерфейсу APIYI (apiyi.com) вы можете переключать маршрутизацию моделей практически без затрат.
Подключение Gemini 3.5 Flash через APIYI и бесплатный пробный период
Интеграция Gemini 3.5 Flash на платформе APIYI (apiyi.com) полностью совместима с OpenAI, поэтому разработчикам не нужно перенастраивать логику аутентификации или маршрутизации. Новые пользователи получают бонус в размере 0,05 $ сразу после регистрации — этого хватит, чтобы полностью прогнать официальные примеры и провести полноценное регрессионное тестирование вашего Agent-воркфлоу.
Минималистичный пример вызова
from openai import OpenAI
client = OpenAI(
api_key="YOUR_APIYI_KEY",
base_url="https://api.apiyi.com/v1",
)
response = client.chat.completions.create(
model="gemini-3.5-flash",
messages=[
{"role": "system", "content": "Ты — инженер по оркестрации агентов."},
{"role": "user", "content": "Спланируй цепочку инструментов для получения issue из GitHub и создания еженедельного отчета."},
],
)
print(response.choices[0].message.content)
Посмотреть полный пример с использованием function calling
from openai import OpenAI
client = OpenAI(
api_key="YOUR_APIYI_KEY",
base_url="https://api.apiyi.com/v1",
)
tools = [
{
"type": "function",
"function": {
"name": "fetch_github_issues",
"description": "Получить список issue для указанного репозитория",
"parameters": {
"type": "object",
"properties": {
"repo": {"type": "string", "description": "владелец/репозиторий"},
"state": {"type": "string", "enum": ["open", "closed", "all"]},
},
"required": ["repo"],
},
},
}
]
response = client.chat.completions.create(
model="gemini-3.5-flash",
messages=[
{"role": "user", "content": "Посмотри, какие новые issue появились на этой неделе в репозитории anthropics/anthropic-cookbook"},
],
tools=tools,
tool_choice="auto",
)
print(response.choices[0].message)
💡 Совет по тестированию: При цене Gemini 3.5 Flash в 1,50 $ за 1 млн входных токенов и 9 $ за 1 млн выходных, бонус в 0,05 $ позволит обработать около 30–40 тысяч входных или 5000 выходных токенов. Этого достаточно, чтобы полностью прогнать ваши текущие промпты на APIYI (apiyi.com). Рекомендуем сразу использовать бесплатные средства для реальных задач, а не просто для тестов, чтобы понять, действительно ли «Flash превосходит Pro» в ваших бизнес-сценариях.
Три шага для подключения
- Зарегистрируйтесь на APIYI (apiyi.com) и пройдите верификацию, чтобы получить 0,05 $ на счет.
- Сгенерируйте API-ключ в панели управления, замените
base_urlв SDK OpenAI наhttps://api.apiyi.com/v1, а в полеmodelукажитеgemini-3.5-flash. - Используйте ваши текущие промпты от GPT-5.5 Instant или Gemini 3.1 Pro Preview, чтобы сравнить качество ответов, задержку и расход токенов.
Часто задаваемые вопросы по Gemini 3.5 Flash
Q1: Кто сильнее: Gemini 3.5 Flash или Gemini 3.1 Pro Preview?
Зависит от задачи. В агентских и кодинг-задачах (Terminal-Bench 2.1, MCP Atlas, Finance Agent v2, GDPval-AA и др.) Gemini 3.5 Flash показывает себя лучше, чем Gemini 3.1 Pro. Однако в тестах на чисто академические рассуждения (Humanity's Last Exam) и абстрактное мышление (ARC-AGI-2) он немного уступает 3.1 Pro. Вывод: если вы занимаетесь агентами, вызовом инструментов, кодом или RAG по длинным документам — выбирайте Gemini 3.5 Flash. Для статических рассуждений или академических целей можно оставить 3.1 Pro. Сравните их прямо сейчас на APIYI (apiyi.com).
Q2: Почему у Gemini 3.5 Flash больше нет суффикса «preview»?
Google изменила стратегию выпуска моделей для серии 3.5. Модель 3.5 Flash сразу вышла в статусе GA (General Availability) под идентификатором gemini-3.5-flash (внутренняя версия 3.5-flash-05-2026). Это означает, что она прошла все проверки безопасности и готова к промышленному использованию с соответствующим SLA. В отличие от Gemini 3.1 Pro Preview, вы можете смело использовать её в продакшене, не опасаясь внезапных изменений или отключения.
Q3: На сколько запросов хватит 0,05 $?
При цене 1,50 $ за 1 млн входных и 9 $ за 1 млн выходных токенов, 0,05 $ хватит примерно на 30 000 входных и 1 500 выходных токенов. Это эквивалентно 30–50 диалогам средней длины. Если включить кэширование промптов (prompt caching), где попадания в кэш стоят 0,15 $ за 1 млн токенов, бесплатный лимит можно растянуть еще сильнее.
Q4: Поддерживает ли Gemini 3.5 Flash ввод видео и аудио?
Да. Gemini 3.5 Flash поддерживает текст, изображения, аудио и видео (вывод только текстовый). Учтите, что видео и аудио тарифицируются по количеству токенов. Интерфейс APIYI (apiyi.com) полностью поддерживает эти параметры, поэтому вы можете использовать ваш существующий код для мультимодальных вызовов Gemini 3.x без изменений.
Итоги: Gemini 3.5 Flash — самое перспективное обновление модели в мае
Вернемся к самому контринтуитивному факту: Gemini 3.5 Flash превзошла предыдущую версию Gemini 3.1 Pro в задачах для агентов и написании кода. При этом она стоит на 25% дешевле, обладает базой знаний, актуальной на январь 2026 года, а скорость генерации, согласно официальным тестам, в 4 раза выше, чем у аналогичных передовых моделей. Для команд, работающих с ИИ-агентами, вызовом инструментов, RAG по длинным документам и корпоративными автоматизированными рабочими процессами, это обновление от Google — лучшее, что стоит протестировать прямо сейчас в первой половине 2026 года.
Gemini 3.5 Flash уже доступна на платформе APIYI (apiyi.com). Новые пользователи получают приветственный бонус в размере 0,05 USD, что позволяет провести интеграционное тестирование без каких-либо затрат. Мы рекомендуем в первую очередь использовать её на уровне диспетчеризации инструментов в агентских рабочих процессах. Благодаря совместимости APIYI (apiyi.com) с интерфейсом OpenAI, вы можете легко подключить модель, получая доступ к новейшим технологиям Google и сохраняя возможность гибкой маршрутизации между такими моделями, как Claude Opus 4.7, GPT-5.5 Instant, Gemini 3.1 Pro и другими.
Автор: Техническая команда APIYI · apiyi.com
Дата публикации: 20 мая 2026 г.
Источники: Google AI for Developers, LLM-Stats, Artificial Analysis, Simon Willison Blog, Interesting Engineering, 9to5Google
