Gemini API | Новости API больших моделей

APIYI запускает API Gemini 3.5 Flash: бесплатная пробная версия + 4-кратное ускорение и полный разбор 8 ключевых показателей тестирования

ОтAPIYI - Stable and affordable AI API 2026年 5月 20日

19 мая 2026 года на конференции Google I/O 2026 компания Google официально представила Gemini 3.5 Flash. Это первая модель из семейства Gemini 3.5, доступная широкой публике. API-идентификатор модели — gemini-3.5-flash, без суффикса «preview», что означает её статус GA (General Availability), то есть полноценный релиз, а не тестовая версия. В тот же день платформа APIYI (apiyi.com) завершила интеграцию, и теперь разработчики могут использовать Gemini 3.5 Flash в своих продуктах через совместимый с OpenAI интерфейс. Новые пользователи получают 0,05 доллара на баланс при регистрации, что позволяет протестировать модель бесплатно.

Больше всего разработчиков удивил феномен «Flash обходит Pro»: в тестах Terminal-Bench 2.1, MCP Atlas, Finance Agent v2, GDPval-AA и других бенчмарках для агентов модель показала результаты выше, чем у флагмана предыдущего поколения Gemini 3.1 Pro. При этом скорость вывода, по официальным данным, примерно в 4 раза выше, чем у аналогичных моделей этого класса. Для команд, работающих с кодинг-агентами, рабочими процессами вызова инструментов и обработкой длинных документов, это самое важное обновление мая. Рекомендуем сначала протестировать свои реальные задачи с помощью бесплатного лимита на APIYI (apiyi.com), прежде чем переключать продакшн-решения с Flash на версию 3.5.

Что такое Gemini 3.5 Flash: позиционирование официальной версии от Google

Gemini 3.5 Flash — это легкая флагманская модель из семейства Gemini 3.5 от Google DeepMind, позиционируемая как «Agentic Flash». Она сохраняет низкую задержку и высокую пропускную способность, свойственные серии Flash, но при этом получила возможности управления инструментами и многошагового рассуждения, которые раньше были доступны только в моделях Pro. На презентации Google подчеркнула, что 3.5 Flash — их самая мощная модель для агентской оркестрации, которая уже развернута в приложениях Gemini, AI Mode в Google Search, Google Antigravity, Google AI Studio и облачных корпоративных сервисах.

В этом релизе есть четыре ключевых момента. Во-первых, у модели нет суффикса «preview», а внутренний номер версии — 3.5-flash-05-2026, что означает готовность к промышленному использованию. Во-вторых, по умолчанию включена функция Dynamic Thinking (динамическое мышление): модель сама определяет, нужно ли ей разворачивать цепочку рассуждений, и разработчикам не нужно вручную настраивать «бюджет мышления». В-третьих, доступны все инструменты: вызов функций (function calling), структурированный вывод, поиск как инструмент (Search-as-a-Tool) и выполнение кода (Code Execution). В-четвертых, база знаний актуальна по январь 2026 года, что делает её одной из самых свежих среди популярных закрытых моделей.

В таблице ниже собраны основные характеристики Gemini 3.5 Flash, основанные на официальной документации Google AI for Developers и данных тестов LLM-Stats и Artificial Analysis.

Параметр	Значение Gemini 3.5 Flash	Примечание
Дата выпуска	19 мая 2026 г.	Презентация Google I/O 2026
ID модели	`gemini-3.5-flash`	Официальная версия, без суффикса preview
Внутренняя версия	`3.5-flash-05-2026`	Соответствует Google AI Studio
Позиционирование	Agentic Flash · Оркестрация инструментов + кодинг	Обходит 3.1 Pro в тестах агентов
Контекстное окно	1 048 576 входных / 65 536 выходных токенов	1 млн / 64 тыс.
Входные модальности	Текст + изображение + аудио + видео	Вывод только текст
Динамическое мышление	Включено по умолчанию	Не требуется настройка бюджета
Инструменты	Function calling / Структурированный вывод / Search-as-a-Tool / Code Execution	Полный стек для агентов
Актуальность знаний	Январь 2026 г.	На уровне GPT-5.5, Claude Opus 4.7
Доступ к API	Совместимость с OpenAI / Нативный Gemini	APIYI (apiyi.com) поддерживает оба способа

🎯 Совет по интеграции: Главное изменение в Gemini 3.5 Flash — это превращение «легкой модели с вызовом инструментов» в стандартную возможность. Поэтому наиболее эффективный способ — использовать её как «уровень управления инструментами» в агентском рабочем процессе. Мы рекомендуем получить бесплатные 0,05 доллара на платформе APIYI (apiyi.com), прогнать ваши текущие рабочие процессы (GPT-5.5 Instant / Claude Haiku 4.5 / Gemini 3.1 Flash) через gemini-3.5-flash для регрессионного тестирования, а затем принимать решение о внедрении в продакшн.

Краткий обзор цен и контекстного окна Gemini 3.5 Flash

Ценообразование Gemini 3.5 Flash стало еще одним поводом для жарких дискуссий после релиза. Google подняла цены на серию Flash: с $0.50 / $4 для 3 Flash Preview до $1.50 / $9 для 3.5 Flash, что уже приближается к уровню Gemini 3.1 Pro ($2 / $12). Саймон Уиллисон в англоязычном сообществе предположил, что Google «тестирует ценовую терпимость API-клиентов». Это также означает, что цель 3.5 Flash — не стать дешевле, а предложить интеллект уровня Pro по стоимости линейки Flash.

В таблице ниже мы сравнили официальные цены Gemini 3.5 Flash с актуальными моделями того же класса, чтобы вы могли оценить выгоду для своих задач. Все цены указаны за 1 млн токенов.

Модель	Цена на вход	Цена на выход	Кэшированный вход	Контекстное окно
Gemini 3.5 Flash	$1.50	$9.00	$0.15	1M / 64K выход
Gemini 3.1 Pro	$2.00	$12.00	$0.20	1M / 64K выход
Gemini 3.1 Flash-Lite	$0.25	$1.50	$0.025	1M / 64K выход
GPT-5.5 (основная)	$5.00	$30.00	$0.50	400K вход
Claude Opus 4.7 (1M)	$15.00	$75.00	$1.50	1M вход

Обратите внимание на три ключевых момента. Во-первых, по сравнению с Gemini 3.1 Pro, Gemini 3.5 Flash дешевле на 25%, но при этом показывает лучшие результаты в кодинге и агентских задачах — для пользователей Pro это отличный шанс «апгрейднуться с экономией». Во-вторых, по сравнению с GPT-5.5, цена за токен у Gemini 3.5 Flash почти в три раза ниже, а разрыв в индексе Artificial Analysis Intelligence Index составляет всего 5 баллов, что делает её идеальной для чувствительных к бюджету диалоговых систем и агентов. В-третьих, по сравнению с Claude Opus 4.7, при разнице в интеллекте всего в 2 балла, стоимость 3.5 Flash в десять раз ниже, что позволяет существенно сэкономить бюджет при работе с экстремально длинным контекстом.

💡 Совет по оптимизации затрат: Gemini 3.5 Flash предлагает цену $0.15 / 1M для кэшированных входных данных, что идеально подходит для длинных системных промптов и RAG-сценариев с большими документами. Рекомендуем включить prompt caching на платформе APIYI (apiyi.com), чтобы повторно использовать фиксированные инструкции, фрагменты базы знаний и историю длинных диалогов. Это позволит снизить стоимость 1M токенов на входе до уровня 3.1 Flash-Lite.

Ключевые бенчмарки Gemini 3.5 Flash: сравнение с Gemini 3.1 Pro

Самый контринтуитивный факт релиза — «Flash обошел Pro». Официальные данные Google и независимые тесты LLM-Stats подтверждают: в задачах на работу с агентами, оркестрацию инструментов, кодинг и финансовый анализ 3.5 Flash превосходит Gemini 3.1 Pro. Уступает он лишь в чисто академических рассуждениях (Humanity's Last Exam) и абстрактной логике (ARC-AGI-2).

Ниже приведена сводная таблица ключевых бенчмарков:

Бенчмарк	Gemini 3.5 Flash	Gemini 3.1 Pro	Разница	Навык
Terminal-Bench 2.1	76.2%	70.3%	+5.9	Агент кодинга в терминале
MCP Atlas	83.6%	78.2%	+5.4	Вызов инструментов MCP
Finance Agent v2	57.9%	43.0%	+14.9	Агент фин. документации
GDPval-AA (Elo)	1656	1314	+342	Общий агентский интеллект
CharXiv Reasoning	84.2%	—	—	Анализ графиков
Humanity's Last Exam	40.2%	44.4%	-4.2	Академические рассуждения
ARC-AGI-2	72.1%	77.1%	-5.0	Абстрактная логика
Скорость вывода	~284 токена/с	медленнее	—	Реакция в реальном времени

Эти данные говорят о трех вещах. Во-первых, преимущество Gemini 3.5 Flash сосредоточено в задачах на вызов инструментов и работу агентов. Во-вторых, статические знания и абстрактная логика остаются сильной стороной Pro-моделей — если ваша нагрузка связана с математикой или академическими задачами, 3.5 Flash может быть не лучшим выбором. В-третьих, Google фактически провела «перераспределение ролей» в линейке моделей; по слухам, Gemini 3.5 Pro выйдет в следующем месяце и поднимет планку возможностей еще выше.

Отдельно стоит отметить Artificial Analysis Intelligence Index. Gemini 3.5 Flash набрала 55 баллов, уступив Claude Opus 4.7 всего 2 балла, а GPT-5.5 — 5 баллов. Учитывая, что стоимость входа у 3.5 Flash в десять раз ниже, чем у Opus, и в три раза ниже, чем у GPT-5.5, это одна из самых выгодных моделей «первого эшелона». Рекомендуем попробовать её в качестве модели по умолчанию для агентов на платформе APIYI (apiyi.com), чтобы снизить нагрузку на поддержку инфраструктуры при работе с разными вендорами.

Анализ влияния Gemini 3.5 Flash: что это значит для разработчиков

Этот релиз — не просто появление очередной модели в списке доступных. Google представила комплексное решение в рамках стратегии «Flash + Агент», которое способно конкурировать с GPT-5.5 и Claude Opus 4.7. Это событие переформатирует несколько ключевых рабочих процессов в ближайшие 1–2 квартала.

Прямое влияние на разработчиков агентов

Команды, работающие над агентами, — главные бенефициары Gemini 3.5 Flash. Судя по бенчмаркам, рост показателей в Terminal-Bench 2.1 и MCP Atlas означает, что традиционные «узкие места» в виде многошагового вызова инструментов и восстановления после ошибок наконец-то сгладились. Улучшение на 14,9 пункта в Finance Agent v2 говорит о значительном прогрессе в обработке структурированных документов. Такие компании, как Shopify, Macquarie Bank, Salesforce, Ramp, Xero и Databricks, уже стали первыми партнерами Google, применяя модель в анализе данных, работе с финансовой документацией, автоматизации бизнес-процессов, OCR счетов и налоговых потоках. Если в вашем продукте есть цепочка «чтение документа → вызов инструмента → вывод структурированного результата», Gemini 3.5 Flash — кандидат, которого стоит оценить прямо сейчас.

Влияние на RAG-приложения с длинным контекстом

Gemini 3.5 Flash сохраняет окно в 1 млн токенов на вход и 64 тыс. на выход. В сочетании с ценой кэширования входных данных $0.15 / 1 млн токенов, это делает «RAG с миллионным контекстом» доступным для обычных SaaS-решений. Для справки: фиксированная база знаний на 500 тыс. токенов + 50 тыс. токенов на вопрос пользователя при использовании кэширования обойдутся менее чем в 0,1 доллара за один вывод. Это значительно дешевле, чем разбивать тот же контекст для GPT-5.5 или Claude Opus 4.7. Рекомендуем перевести цепочки RAG с длинным контекстом на gemini-3.5-flash через APIYI (apiyi.com) — стратегии кэширования можно реализовать, используя существующие интерфейсы Gemini.

Влияние на стратегии маршрутизации моделей

После запуска Gemini 3.5 Flash привычные стратегии маршрутизации требуют пересмотра. Старое разделение «GPT для диалогов, Claude для кода, Gemini для мультимодальности» больше не актуально, так как Gemini 3.5 Flash конкурентоспособен во всех трех направлениях: кодинг-агенты, вызов инструментов и мультимодальный ввод. Мы предлагаем сделать gemini-3.5-flash новой «базовой моделью для инструментов», а GPT-5.5 Instant, Claude Opus 4.7 и Gemini 3.1 Pro оставить для специфических задач. Благодаря единому интерфейсу APIYI (apiyi.com) вы можете переключать маршрутизацию моделей практически без затрат.

Подключение Gemini 3.5 Flash через APIYI и бесплатный пробный период

Интеграция Gemini 3.5 Flash на платформе APIYI (apiyi.com) полностью совместима с OpenAI, поэтому разработчикам не нужно перенастраивать логику аутентификации или маршрутизации. Новые пользователи получают бонус в размере 0,05 $ сразу после регистрации — этого хватит, чтобы полностью прогнать официальные примеры и провести полноценное регрессионное тестирование вашего Agent-воркфлоу.

Минималистичный пример вызова

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_APIYI_KEY",
    base_url="https://api.apiyi.com/v1",
)

response = client.chat.completions.create(
    model="gemini-3.5-flash",
    messages=[
        {"role": "system", "content": "Ты — инженер по оркестрации агентов."},
        {"role": "user", "content": "Спланируй цепочку инструментов для получения issue из GitHub и создания еженедельного отчета."},
    ],
)
print(response.choices[0].message.content)

Посмотреть полный пример с использованием function calling

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_APIYI_KEY",
    base_url="https://api.apiyi.com/v1",
)

tools = [
    {
        "type": "function",
        "function": {
            "name": "fetch_github_issues",
            "description": "Получить список issue для указанного репозитория",
            "parameters": {
                "type": "object",
                "properties": {
                    "repo": {"type": "string", "description": "владелец/репозиторий"},
                    "state": {"type": "string", "enum": ["open", "closed", "all"]},
                },
                "required": ["repo"],
            },
        },
    }
]

response = client.chat.completions.create(
    model="gemini-3.5-flash",
    messages=[
        {"role": "user", "content": "Посмотри, какие новые issue появились на этой неделе в репозитории anthropics/anthropic-cookbook"},
    ],
    tools=tools,
    tool_choice="auto",
)
print(response.choices[0].message)

💡 Совет по тестированию: При цене Gemini 3.5 Flash в 1,50 $ за 1 млн входных токенов и 9 $ за 1 млн выходных, бонус в 0,05 $ позволит обработать около 30–40 тысяч входных или 5000 выходных токенов. Этого достаточно, чтобы полностью прогнать ваши текущие промпты на APIYI (apiyi.com). Рекомендуем сразу использовать бесплатные средства для реальных задач, а не просто для тестов, чтобы понять, действительно ли «Flash превосходит Pro» в ваших бизнес-сценариях.

Три шага для подключения

Зарегистрируйтесь на APIYI (apiyi.com) и пройдите верификацию, чтобы получить 0,05 $ на счет.
Сгенерируйте API-ключ в панели управления, замените base_url в SDK OpenAI на https://api.apiyi.com/v1, а в поле model укажите gemini-3.5-flash.
Используйте ваши текущие промпты от GPT-5.5 Instant или Gemini 3.1 Pro Preview, чтобы сравнить качество ответов, задержку и расход токенов.

Часто задаваемые вопросы по Gemini 3.5 Flash

Q1: Кто сильнее: Gemini 3.5 Flash или Gemini 3.1 Pro Preview?

Зависит от задачи. В агентских и кодинг-задачах (Terminal-Bench 2.1, MCP Atlas, Finance Agent v2, GDPval-AA и др.) Gemini 3.5 Flash показывает себя лучше, чем Gemini 3.1 Pro. Однако в тестах на чисто академические рассуждения (Humanity's Last Exam) и абстрактное мышление (ARC-AGI-2) он немного уступает 3.1 Pro. Вывод: если вы занимаетесь агентами, вызовом инструментов, кодом или RAG по длинным документам — выбирайте Gemini 3.5 Flash. Для статических рассуждений или академических целей можно оставить 3.1 Pro. Сравните их прямо сейчас на APIYI (apiyi.com).

Q2: Почему у Gemini 3.5 Flash больше нет суффикса «preview»?

Google изменила стратегию выпуска моделей для серии 3.5. Модель 3.5 Flash сразу вышла в статусе GA (General Availability) под идентификатором gemini-3.5-flash (внутренняя версия 3.5-flash-05-2026). Это означает, что она прошла все проверки безопасности и готова к промышленному использованию с соответствующим SLA. В отличие от Gemini 3.1 Pro Preview, вы можете смело использовать её в продакшене, не опасаясь внезапных изменений или отключения.

Q3: На сколько запросов хватит 0,05 $?

При цене 1,50 $ за 1 млн входных и 9 $ за 1 млн выходных токенов, 0,05 $ хватит примерно на 30 000 входных и 1 500 выходных токенов. Это эквивалентно 30–50 диалогам средней длины. Если включить кэширование промптов (prompt caching), где попадания в кэш стоят 0,15 $ за 1 млн токенов, бесплатный лимит можно растянуть еще сильнее.

Q4: Поддерживает ли Gemini 3.5 Flash ввод видео и аудио?

Да. Gemini 3.5 Flash поддерживает текст, изображения, аудио и видео (вывод только текстовый). Учтите, что видео и аудио тарифицируются по количеству токенов. Интерфейс APIYI (apiyi.com) полностью поддерживает эти параметры, поэтому вы можете использовать ваш существующий код для мультимодальных вызовов Gemini 3.x без изменений.

Итоги: Gemini 3.5 Flash — самое перспективное обновление модели в мае

Вернемся к самому контринтуитивному факту: Gemini 3.5 Flash превзошла предыдущую версию Gemini 3.1 Pro в задачах для агентов и написании кода. При этом она стоит на 25% дешевле, обладает базой знаний, актуальной на январь 2026 года, а скорость генерации, согласно официальным тестам, в 4 раза выше, чем у аналогичных передовых моделей. Для команд, работающих с ИИ-агентами, вызовом инструментов, RAG по длинным документам и корпоративными автоматизированными рабочими процессами, это обновление от Google — лучшее, что стоит протестировать прямо сейчас в первой половине 2026 года.

Gemini 3.5 Flash уже доступна на платформе APIYI (apiyi.com). Новые пользователи получают приветственный бонус в размере 0,05 USD, что позволяет провести интеграционное тестирование без каких-либо затрат. Мы рекомендуем в первую очередь использовать её на уровне диспетчеризации инструментов в агентских рабочих процессах. Благодаря совместимости APIYI (apiyi.com) с интерфейсом OpenAI, вы можете легко подключить модель, получая доступ к новейшим технологиям Google и сохраняя возможность гибкой маршрутизации между такими моделями, как Claude Opus 4.7, GPT-5.5 Instant, Gemini 3.1 Pro и другими.

Автор: Техническая команда APIYI · apiyi.com
Дата публикации: 20 мая 2026 г.
Источники: Google AI for Developers, LLM-Stats, Artificial Analysis, Simon Willison Blog, Interesting Engineering, 9to5Google

APIYI - Stable and affordable AI API

Try AI Large Model https://api.apiyi.com for free
Stable and reliable AI LM API aggregation service, Get 300 Millions Tokens for Free~

API видео ИИ | Новости API больших моделей

Глубокий анализ цен HappyHorse: сравнение с SeeDance 2.0 по 5 параметрам для понимания реальной стоимости генерации видео
ОтAPIYI - Stable and affordable AI API 2026年 4月 28日

Тайна ценообразования HappyHorse наконец раскрыта. После того как 27 апреля 2026 года платформа Alibaba Cloud Bailian открыла корпоративное тестирование HappyHorse API, стали известны и официальные тарифы: стоимость HappyHorse-1.0-T2V рассчитывается посекундно — 0,9 юаня за секунду для 720P и 1,6 юаня за секунду для 1080P. Используется максимально простая формула: «количество × секунды × цена за единицу»….

Читайте далее Глубокий анализ цен HappyHorse: сравнение с SeeDance 2.0 по 5 параметрам для понимания реальной стоимости генерации видео
Gemini API | Устранение проблем с AI-моделями

3 способа продолжить использовать Gemini после исчерпания бесплатного лимита AI Studio
ОтAPIYI - Stable and affordable AI API 2026年 1月 26日

Закончился бесплатный лимит в AI Studio? 3 способа продолжить использование Gemini Проблема 429 Rate Limit RPM: 5 зап/мин RPD: 25 зап/день Лимит исчерпан! Снижение квот в 12.2025 Решение 1. Экспорт кода (локально) 2. Прокси-сервис API ⭐ 3. Платный уровень Рекомендуем вариант 2 Результат ✓ Продолжение работы ✓ Без ограничений ✓ Все модели ✓ Оплата по…

Читайте далее 3 способа продолжить использовать Gemini после исчерпания бесплатного лимита AI Studio
Gemini API | Новости API больших моделей

Полный обзор Google Gemma 4: 4 модели с открытым исходным кодом, лицензия Apache 2.0 и 6 ключевых обновлений
ОтAPIYI - Stable and affordable AI API 2026年 4月 3日

Состоялся официальный релиз Google Gemma 4. Модель впервые распространяется по полностью открытой лицензии Apache 2.0 и представлена в 4 вариантах, охватывающих любые сценарии: от Raspberry Pi до мощных дата-центров. Будучи открытой версией технологий, лежащих в основе Gemini 3, Gemma 4 демонстрирует колоссальный прирост производительности в задачах логического вывода, кодинга, работы с визуальными данными и длинным…

Читайте далее Полный обзор Google Gemma 4: 4 модели с открытым исходным кодом, лицензия Apache 2.0 и 6 ключевых обновлений
Новости API больших моделей | Объявления

Освоение модели Seed 2.0 Lite 260228: запуск официального сервис-прокси API от BytePlus, полный разбор контекстного окна 256K всего за $0.25 за 1 млн токенов
ОтAPIYI - Stable and affordable AI API 2026年 3月 8日

Примечание автора: Seed 2.0 Lite 260228 официально запущена на платформе BytePlus ModelArk. Модель поддерживает контекстное окно 256K, а ступенчатые тарифы начинаются всего от $0.25 за 1 млн токенов. В этой статье мы подробно разберем возможности модели, ценовую политику и способы подключения через API. В линейке Seed 2.0 от ByteDance пополнение. Модель seed-2-0-lite-260228 официально вышла на…

Читайте далее Освоение модели Seed 2.0 Lite 260228: запуск официального сервис-прокси API от BytePlus, полный разбор контекстного окна 256K всего за $0.25 за 1 млн токенов
API видео ИИ | Новости API больших моделей

Подробный обзор функции экспорта GIF в Google Flow: полное руководство по скачиванию ИИ-видео в 3 форматах в один клик
ОтAPIYI - Stable and affordable AI API 2026年 1月 27日

Глядя на эффектные GIF-анимации на официальном сайте Google Flow, многие задаются вопросом: это функция загрузки сторонних GIF или инструмент для их создания? Ответ прост: Google Flow предлагает функцию скачивания видео с конвертацией в GIF. Это позволяет в один клик превратить ИИ-видео, созданное с помощью Veo 3.1, в удобный формат анимации, которым легко делиться. Главное в…

Читайте далее Подробный обзор функции экспорта GIF в Google Flow: полное руководство по скачиванию ИИ-видео в 3 форматах в один клик
Выбор и сравнение моделей | Новости API больших моделей

Сравнение Claude Code и GPT-5.4 в программировании: стоит ли отменять подписку на Claude Code? Практический анализ по 6 критериям
ОтAPIYI - Stable and affordable AI API 2026年 3月 6日

От автора: Нейтральное сравнение возможностей программирования, качества кода, контекстного окна, цены и опыта разработчика (DX) Claude Code и GPT-5.4. Поможем решить, стоит ли переходить. В день релиза GPT-5.4 в соцсетях прозвучало: «Отменяйте подписку на Claude Code!» Аргументы весомые — контекстное окно 1M, лидерство по всем фронтам, и, наконец-то, модель стала «говорить по-человечески». Но реальность сложнее….

Читайте далее Сравнение Claude Code и GPT-5.4 в программировании: стоит ли отменять подписку на Claude Code? Практический анализ по 6 критериям