Gemini 3.1 Pro Preview добавила средний уровень мышления (medium), и это одно из главных отличий от предыдущего поколения Gemini 3 Pro. Теперь вы можете точно контролировать глубину рассуждений модели, выбирая между уровнями low, medium и high, причем режим high активирует возможности Deep Think Mini.
Основная ценность: Прочитав эту статью, вы научитесь полностью настраивать параметр thinkingLevel и находить идеальный баланс между качеством, скоростью и стоимостью.

Матрица поддержки уровней мышления в Gemini 3.1 Pro
Для начала оценим общую картину: разные модели Gemini поддерживают разные уровни мышления.
| Уровень мышления | Gemini 3.1 Pro | Gemini 3 Pro | Gemini 3 Flash | Описание |
|---|---|---|---|---|
| minimal | ❌ Не поддерживается | ❌ Не поддерживается | ✅ Поддерживается | Почти без рассуждений, доступно только в Flash |
| low | ✅ Поддерживается | ✅ Поддерживается | ✅ Поддерживается | Быстрый отклик, минимальная стоимость |
| medium | ✅ Новая поддержка | ❌ Не поддерживается | ✅ Поддерживается | Сбалансированные рассуждения, ключевое обновление 3.1 Pro |
| high | ✅ Поддерживается (по умолчанию) | ✅ Поддерживается (по умолчанию) | ✅ Поддерживается (по умолчанию) | Самые глубокие рассуждения, активация Deep Think Mini |
Ключевые изменения: эволюция уровней от 3 Pro к 3.1 Pro
| Сравнение | Gemini 3 Pro | Gemini 3.1 Pro |
|---|---|---|
| Доступные уровни | low, high (всего 2) | low, medium, high (3 уровня) |
| Уровень по умолчанию | high | high |
| Что значит режим high | Глубокие рассуждения | Deep Think Mini (еще мощнее) |
| Можно ли отключить рассуждения | Нет | Нет |
Главное понимание: Глубина рассуждений в режиме high у Gemini 3 Pro примерно соответствует уровню medium в Gemini 3.1 Pro. А режим high в версии 3.1 Pro — это совершенно новый Deep Think Mini, чья способность к логическим выводам значительно превосходит предыдущее поколение.
🎯 Совет по миграции: Если вы раньше использовали Gemini 3 Pro в режиме high, то при переходе на 3.1 Pro рекомендуем сначала попробовать medium (это обеспечит привычное качество и стоимость). Включайте high только тогда, когда задаче действительно требуются сверхглубокие рассуждения. APIYI (apiyi.com) поддерживает все модели Gemini и любые уровни мышления.
Способы настройки API для уровней рассуждения Gemini 3.1 Pro
Вызов через APIYI (совместимый с OpenAI формат)
import openai
client = openai.OpenAI(
api_key="YOUR_API_KEY",
base_url="https://api.apiyi.com/v1" # APIYI 统一接口
)
# LOW 模式: 快速响应
response_low = client.chat.completions.create(
model="gemini-3.1-pro-preview",
messages=[{"role": "user", "content": "把这段英文翻译成中文: Hello World"}],
extra_body={
"thinking": {"type": "enabled", "budget_tokens": 1024}
}
)
# MEDIUM 模式: 平衡推理 (新增!)
response_med = client.chat.completions.create(
model="gemini-3.1-pro-preview",
messages=[{"role": "user", "content": "审查这段代码有没有内存泄漏风险"}],
extra_body={
"thinking": {"type": "enabled", "budget_tokens": 8192}
}
)
# HIGH 模式: Deep Think Mini
response_high = client.chat.completions.create(
model="gemini-3.1-pro-preview",
messages=[{"role": "user", "content": "证明: 对所有正整数n, n^3-n能被6整除"}],
extra_body={
"thinking": {"type": "enabled", "budget_tokens": 32768}
}
)
Нативный вызов через Google SDK
from google import genai
from google.genai import types
client = genai.Client()
# 使用 thinkingLevel 参数
response = client.models.generate_content(
model="gemini-3.1-pro-preview",
contents="你的提示词",
config=types.GenerateContentConfig(
thinking_config=types.ThinkingConfig(
thinking_level="MEDIUM" # "LOW" / "MEDIUM" / "HIGH"
)
),
)
# 查看思考 token 消耗
print(f"思考 token: {response.usage_metadata.thoughts_token_count}")
print(f"输出 token: {response.usage_metadata.candidates_token_count}")
Вызов через REST API
POST https://generativelanguage.googleapis.com/v1beta/models/gemini-3.1-pro-preview:generateContent
{
"contents": [{"parts": [{"text": "你的提示词"}]}],
"generationConfig": {
"thinkingConfig": {
"thinkingLevel": "MEDIUM"
}
}
}
⚠️ Важное напоминание:
thinkingLevelиthinkingBudgetнельзя использовать одновременно, иначе вернется ошибка 400. Для моделей Gemini 3+ рекомендуется использоватьthinkingLevel, а для моделей Gemini 2.5 —thinkingBudget.
Подробное сравнение трех уровней рассуждения Gemini 3.1 Pro
LOW: самый быстрый и дешевый
| Параметр | Детали |
|---|---|
| Глубина рассуждения | Минимальное количество токенов рассуждения, но все же лучше, чем у моделей без этой функции |
| Скорость отклика | Секундная (быстрее всего) |
| Стоимость | Самая низкая (мало токенов рассуждения → меньше выходных токенов → ниже цена) |
| Сценарии использования | Автодополнение, классификация, извлечение структурированных данных, простой перевод, суммаризация |
| Не подходит для | Сложных логических цепочек, математических доказательств, многоэтапной отладки |
MEDIUM: сбалансированный выбор (новинка)
| Параметр | Детали |
|---|---|
| Глубина рассуждения | Среднее количество токенов рассуждения, примерно соответствует уровню HIGH в старой версии 3.0 Pro |
| Скорость отклика | Умеренная задержка |
| Стоимость | Средняя |
| Сценарии использования | Ревью кода, анализ документов, повседневное программирование, стандартные вызовы API, ответы на вопросы |
| Не подходит для | Математических задач уровня IMO, экстремально сложных многошаговых рассуждений |
HIGH: Deep Think Mini (по умолчанию)
| Параметр | Детали |
|---|---|
| Глубина рассуждения | Максимальное рассуждение, активирует возможности Deep Think Mini |
| Скорость отклика | Может занять несколько минут (задачи уровня IMO ~8 минут) |
| Стоимость | Самая высокая (большой объем токенов рассуждения тарифицируется по цене выходных токенов) |
| Сценарии использования | Сложная отладка, проектирование алгоритмов, математические доказательства, исследовательские задачи, воркфлоу агентов |
| Особые возможности | Сигнатуры рассуждения (thought signatures) для поддержания непрерывности логики между вызовами API |

Правила тарификации токенов размышления Gemini 3.1 Pro
Понимание принципов тарификации — это ключ к правильному выбору уровня «размышления» (thinking level).
Основные принципы тарификации
| Статья расходов | Описание |
|---|---|
| Тарифицируются ли токены размышления? | Да, по той же цене, что и обычные исходящие токены (output tokens) |
| Цена за исходящие токены | $12.00 / 1 млн токенов (включая токены размышления) |
| База для расчета | Оплата идет за всю внутреннюю цепочку рассуждений, а не только за краткое резюме |
| Резюме размышлений | API возвращает только краткое резюме процесса, но тарифицируется полный объем сгенерированных токенов размышления |
Официальное пояснение Google:
«Модели с функцией мышления генерируют полные цепочки рассуждений для повышения качества финального ответа, а затем выдают резюме, чтобы дать представление о ходе мыслей. Стоимость рассчитывается на основе всех токенов размышления, которые модели пришлось создать для формирования резюме, несмотря на то, что через API передается только само резюме».
Оценка стоимости для трех уровней
| Уровень | Примерное кол-во токенов размышления | На 1000 вызовов | Динамика затрат в месяц |
|---|---|---|---|
| LOW | ~500-2K / раз | $6-24 | Минимальные |
| MEDIUM | ~2K-8K / раз | $24-96 | Средние |
| HIGH | ~8K-32K+ / раз | $96-384+ | Высокие (для сложных задач может быть больше) |
💰 Оптимизация затрат: Не для каждого запроса нужен уровень HIGH. Если установить LOW или MEDIUM для 80% повседневных задач и оставить HIGH только для 20% действительно сложных кейсов, можно сократить расходы на API на 50–70%. Платформа APIYI (apiyi.com) позволяет гибко настраивать эти параметры.
Руководство по выбору уровня размышления Gemini 3.1 Pro для разных задач
Рекомендации по сценариям
| Тип задачи | Рекомендуемый уровень | Обоснование | Ожидаемая задержка |
|---|---|---|---|
| Простой перевод | LOW | Рассуждения не требуются | < 5 сек |
| Классификация текста | LOW | Задача на сопоставление паттернов | < 5 сек |
| Саммаризация | LOW | Сжатие информации, а не логический вывод | < 10 сек |
| Автодополнение | LOW | Критичность к задержкам | < 3 сек |
| Ревью кода | MEDIUM | Требуется умеренный анализ | 10-30 сек |
| Q&A по документам | MEDIUM | Понимание + ответ | 10-30 сек |
| Повседневное написание кода | MEDIUM | Стандартная генерация кода | 15-40 сек |
| Анализ багов | MEDIUM | Рассуждения средней сложности | 20-40 сек |
| Сложная отладка | HIGH | Многошаговая цепочка рассуждений | 1-5 мин |
| Математические доказательства | HIGH | Режим Deep Think Mini | 3-8 мин |
| Проектирование алгоритмов | HIGH | Глубокие рассуждения | 2-5 мин |
| Исследовательская аналитика | HIGH | Многомерный глубокий анализ | 2-5 мин |
| Ворклоу для агентов | HIGH | Сохранение непрерывности логики | Зависит от задачи |
Динамический выбор уровня: пример кода
import openai
client = openai.OpenAI(
api_key="YOUR_API_KEY",
base_url="https://api.apiyi.com/v1" # Единый интерфейс APIYI
)
# Автоматический выбор уровня размышления в зависимости от типа задачи
THINKING_CONFIG = {
"simple": {"type": "enabled", "budget_tokens": 1024}, # LOW
"medium": {"type": "enabled", "budget_tokens": 8192}, # MEDIUM
"complex": {"type": "enabled", "budget_tokens": 32768}, # HIGH
}
def smart_think(prompt, complexity="medium"):
"""Автоматическая настройка уровня размышления в зависимости от сложности задачи"""
return client.chat.completions.create(
model="gemini-3.1-pro-preview",
messages=[{"role": "user", "content": prompt}],
extra_body={"thinking": THINKING_CONFIG[complexity]}
)
# Простой перевод → LOW
resp1 = smart_think("Переведи: Good morning", "simple")
# Ревью кода → MEDIUM
resp2 = smart_think("Проверь этот код на безопасность: ...", "medium")
# Математическое доказательство → HIGH (Deep Think Mini)
resp3 = smart_think("Докажи частный случай гипотезы Римана", "complex")
Gemini 3.1 Pro vs 3 Pro: Сравнение эволюции уровней мышления

В чем на самом деле фишка Deep Think Mini
Активация Deep Think Mini в режиме HIGH у Gemini 3.1 Pro — это, пожалуй, самое крутое в этом обновлении.
Что такое Deep Think Mini
Deep Think Mini — это не какая-то отдельная модель, а специальный режим рассуждений, который включается у Gemini 3.1 Pro на уровне мышления HIGH. Google описывает его как «мини-версию Gemini Deep Think» — тяжеловесной модели Google, созданной специально для сложных логических задач (ее результат в ARC-AGI-2 составляет впечатляющие 84,6%).
Реальные показатели Deep Think Mini
| Тест | Deep Think Mini (3.1 Pro HIGH) | Gemini 3 Pro HIGH | Прирост |
|---|---|---|---|
| ARC-AGI-2 | 77.1% | 31.1% | +148% |
| Математика IMO | Решает за ~8 минут | Не может решить | Качественный скачок |
| Сложное планирование | Прирост 40-60% | По сравнению с Gemini 2.5 Pro | Значительный рост |
Сигнатуры мышления (Thought Signatures)
В Deep Think Mini реализована уникальная технология: сигнатуры мышления (thought signatures). Это зашифрованные, защищенные от подделки представления промежуточных этапов рассуждения.
В рабочих процессах (воркфлоу) ИИ-агентов рассуждения модели часто распределяются между несколькими вызовами API. Сигнатуры мышления позволяют передавать контекст рассуждений из предыдущего вызова в следующий, сохраняя непрерывность логики. Это критически важно для многошаговых задач, выполняемых агентами.
Для каких задач стоит использовать Deep Think Mini
| Стоит включать HIGH (Deep Think Mini) | Достаточно MEDIUM |
|---|---|
| Рассуждения уровня математических олимпиад | Простая арифметика |
| Отладка сложных багов в нескольких файлах | Исправление синтаксических ошибок |
| Проектирование и оптимизация алгоритмов | Генерация CRUD-кода |
| Методологический анализ научных статей | Краткое содержание (саммари) текста |
| Длительные многошаговые задачи агентов | Обычный вопрос-ответ |
| Глубокий анализ уязвимостей безопасности | Конвертация форматов |
💡 Практический совет: Мощь Deep Think Mini имеет свою цену — это повышенная задержка (latency) и стоимость. Рекомендую использовать уровень HIGH только там, где действительно нужны «глубокие раздумья», а для повседневных задач хватит и MEDIUM. Через APIYI (apiyi.com) можно гибко переключать эти уровни для каждого конкретного запроса.
thinkingLevel vs thinkingBudget: не путайте их
У Google есть два параметра для управления процессом мышления (thinking), которые применяются к разным сериям моделей:
| Параметр | Поддерживаемые модели | Тип значения | Описание |
|---|---|---|---|
| thinkingLevel | Gemini 3+ (3 Flash, 3 Pro, 3.1 Pro) | Enum: MINIMAL/LOW/MEDIUM/HIGH | Рекомендуется для серии Gemini 3 |
| thinkingBudget | Gemini 2.5 (Pro, Flash, Flash Lite) | Integer: 0-32768 | Применяется для серии 2.5 |
⚠️ Нельзя использовать оба параметра одновременно! Если передать их вместе, API вернет ошибку 400.
| Сценарий | Как правильно | Как неправильно |
|---|---|---|
| Вызов Gemini 3.1 Pro | Использовать thinkingLevel: "MEDIUM" |
Использовать thinkingBudget: 8192 |
| Вызов Gemini 2.5 Pro | Использовать thinkingBudget: 8192 |
Использовать thinkingLevel: "MEDIUM" |
| Передача обоих параметров | — | Ошибка 400 ❌ |
🎯 Как запомнить: Серия Gemini 3 → thinkingLevel (строковый уровень), серия Gemini 2.5 → thinkingBudget (число токенов). APIYI (apiyi.com) поддерживает оба формата параметров.
Часто задаваемые вопросы (FAQ)
Q1: Какой уровень thinkingLevel используется по умолчанию?
По умолчанию установлен HIGH. Это значит, что если вы не укажете уровень вручную, каждый запрос будет использовать все возможности рассуждения Deep Think Mini, что приведет к максимальному расходу токенов мышления. Рекомендуем выбирать уровень в зависимости от сложности задачи, чтобы сэкономить. Через APIYI (apiyi.com) можно гибко управлять этим параметром для каждого запроса.
Q2: Как тарифицируются токены мышления? Это дорого?
Токены мышления тарифицируются по той же цене, что и исходящие токены ($12.00 за 1 млн токенов). В режиме HIGH сложный запрос может «съесть» более 30 000 токенов мышления, что обойдется примерно в $0.36. В то же время в режиме LOW тот же запрос может потребовать всего 1000 токенов ($0.012). Разница в стоимости может достигать 30 раз.
Q3: Является ли MEDIUM в 3.1 Pro аналогом HIGH в 3.0 Pro?
По сути, да. Google описывает MEDIUM в 3.1 Pro как «сбалансированное мышление, подходящее для большинства задач», что совпадает с позиционированием HIGH в версии 3.0 Pro. Если вы переходите с 3.0 Pro на 3.1 Pro, замена HIGH на MEDIUM поможет сохранить схожее качество при сопоставимых затратах. В APIYI (apiyi.com) можно вызывать обе версии одновременно для сравнения результатов.
Q4: Можно ли полностью отключить функцию мышления?
В Gemini 3.1 Pro нельзя полностью отключить мышление. Минимально возможный уровень — LOW, при котором все равно выполняются базовые рассуждения. Если вам нужен ответ вообще без этапа размышлений, рассмотрите режим MINIMAL в модели Gemini 3 Flash.
Распространенные заблуждения об уровнях мышления Gemini 3.1 Pro
| Заблуждение | Факт |
|---|---|
| «Уровень HIGH дает лучшее качество, нужно всегда использовать его» | На простых задачах качество HIGH близко к MEDIUM, но стоимость выше в 5-10 раз |
| «Уровень LOW очень плохо рассуждает» | LOW все равно лучше моделей без функции рассуждения, просто используется меньше токенов на «раздумья» |
| «MEDIUM — это новая функция, может работать нестабильно» | Глубина рассуждений MEDIUM ≈ уровню HIGH в старой версии 3.0 Pro, функция полностью проверена |
| «Токены рассуждений (thinking tokens) бесплатны» | Платно! Тарифицируются по той же цене, что и исходящие токены ($12/MTok) |
| «Можно отключить рассуждения в 3.1 Pro» | Нельзя, минимум — это LOW, базовые рассуждения все равно сохраняются |
| «thinkingLevel и thinkingBudget можно использовать вместе» | Нет! Одновременное использование приведет к ошибке 400 |
| «На высоком уровне задержка больше, но ответ придет сразу» | В режиме HIGH генерация ответа может начаться только через несколько минут, это не просто небольшая задержка |
Итог: Шпаргалка по выбору уровня мышления Gemini 3.1 Pro
| Уровень | Суть в двух словах | Подходящие сценарии | Относительная стоимость |
|---|---|---|---|
| LOW | Самый быстрый и дешевый | Перевод, классификация, саммари, автодополнение | 1x |
| MEDIUM | Сбалансированный выбор (новинка) | Кодинг, ревью, анализ, Q&A | 2-3x |
| HIGH | Deep Think Mini | Математика, отладка, исследования, агенты | 5-10x+ |
Основные рекомендации:
- Для повседневной разработки используйте MEDIUM — отличное качество при разумной цене, эквивалент старого уровня HIGH.
- Для простых задач выбирайте LOW — это сэкономит более 70% затрат на токены рассуждений.
- Для глубокой логики используйте HIGH — возможности Deep Think Mini уникальны, но следите за бюджетом.
- По умолчанию стоит HIGH — если не задать уровень вручную, включится самый дорогой режим. Не забывайте его менять.
Рекомендуем использовать платформу APIYI (apiyi.com) для динамического переключения уровней мышления в зависимости от типа задачи — это поможет найти идеальный баланс между качеством и стоимостью.
Полезные материалы
-
Документация Google AI: Руководство по настройке мышления Gemini
- Ссылка:
ai.google.dev/gemini-api/docs/thinking - Описание: Полная документация по параметру
thinkingLevel.
- Ссылка:
-
Документация Google AI: Страница модели Gemini 3.1 Pro
- Ссылка:
ai.google.dev/gemini-api/docs/models/gemini-3.1-pro-preview - Описание: Матрица поддержки уровней мышления и важные примечания.
- Ссылка:
-
Страница цен Gemini API: Информация о тарификации токенов мышления
- Ссылка:
ai.google.dev/gemini-api/docs/pricing - Описание: Токены мышления тарифицируются по цене исходящих (output) токенов.
- Ссылка:
-
VentureBeat: Глубокое погружение в Deep Think Mini
- Ссылка:
venturebeat.com/technology/google-gemini-3-1-pro-first-impressions - Описание: Реальные данные тестов: решение задачи IMO (Международной математической олимпиады) за 8 минут.
- Ссылка:
-
Официальный блог Google: Анонс Gemini 3.1 Pro
- Ссылка:
blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro - Описание: Официальное представление трехуровневой системы мышления и Deep Think Mini.
- Ссылка:
📝 Автор: Команда APIYI | По вопросам технического сотрудничества заходите на APIYI apiyi.com
📅 Дата обновления: 20 февраля 2026 г.
🏷️ Ключевые слова: уровни мышления Gemini 3.1 Pro, thinkingLevel, Deep Think Mini, LOW MEDIUM HIGH, вызов API, управление рассуждением (reasoning control)
