|

Разбор адаптивного режима мышления Claude Adaptive Thinking: 4 главных улучшения по сравнению с Extended Thinking

Если вы активно использовали режим Extended Thinking (расширенное мышление) в Claude, обратите внимание: в Claude 4.6 он помечен как Deprecated (устаревший). На смену ему пришел более интеллектуальный режим: Adaptive Thinking (адаптивное мышление).

Главное изменение: раньше вам приходилось вручную задавать бюджет токенов на размышление (budget_tokens), а теперь Claude сам решает, нужно ли ему «думать» и насколько глубоко. Простые вопросы обрабатываются мгновенно, а сложные требуют глубоких рассуждений — и всё это с помощью одного параметра.

Основная ценность: из этой статьи вы узнаете, как использовать API Adaptive Thinking, разберете 4 ключевых обновления, научитесь настраивать параметр effort и получите полное руководство по миграции с Extended Thinking.

claude-adaptive-thinking-mode-api-guide-replace-extended-thinking-ru 图示

Что такое Adaptive Thinking: суть в одном предложении

Extended Thinking (старый режим): вы задаете Claude «бюджет в 10 000 токенов на размышления», и модель тратит их все, независимо от сложности задачи.

Adaptive Thinking (новый режим): Claude самостоятельно оценивает сложность вопроса и решает, «нужно ли думать» и «насколько глубоко погружаться в размышления».

# ❌ Старый режим (Extended Thinking) - скоро будет удален
thinking={"type": "enabled", "budget_tokens": 10000}

# ✅ Новый режим (Adaptive Thinking) - рекомендуется
thinking={"type": "adaptive"}

Краткий обзор ключевых данных

Параметр Детали
Название функции Adaptive Thinking (адаптивное мышление)
Дата релиза 5 февраля 2026 г. (вместе с Claude Opus 4.6)
Поддерживаемые модели Claude Opus 4.6, Claude Sonnet 4.6
API-параметр thinking: {"type": "adaptive"}
Управление Параметр effort (заменяет budget_tokens)
Статус Официальный стандарт (Extended Thinking устарел)
Интерактивное мышление Включено автоматически (без beta-заголовков)
Claude Code Поддерживается нативно, настройка через команду /effort

🎯 Совет по миграции: Если ваш проект все еще использует Extended Thinking (type: "enabled"), рекомендуем как можно скорее перейти на Adaptive Thinking. При использовании API Claude Opus 4.6 или Sonnet 4.6 через сервис-прокси API APIYI (apiyi.com) для миграции достаточно изменить всего один параметр.


Adaptive vs Extended Thinking: 4 главных улучшения

claude-adaptive-thinking-mode-api-guide-replace-extended-thinking-ru 图示

Улучшение 1: от «фиксированного бюджета» к «динамическому решению»

Это самое фундаментальное изменение.

Проблема старого режима: вам приходилось угадывать значение budget_tokens. Если задать слишком мало — модель не справится со сложной логикой; слишком много — вы просто выбрасываете токены (и деньги) на ветер при простых задачах.

# Старый режим: угадайте, сколько токенов нужно для размышлений?
thinking={"type": "enabled", "budget_tokens": 10000}
# Проблема: даже на простые вопросы тратится много токенов

Новый режим: Claude сам решает, сколько нужно ресурсов, исходя из сложности запроса.

# Новый режим: Claude оценивает сам
thinking={"type": "adaptive"}
# Простые вопросы: модель не думает или думает минимально
# Сложные вопросы: глубокий анализ

Практический эффект: для смешанных рабочих нагрузок (например, ревью кода, где один PR — это правка опечатки, а другой — рефакторинг архитектуры) Adaptive Thinking показывает гораздо более высокую эффективность и экономичность.

Улучшение 2: автоматическое интерактивное мышление (Interleaved Thinking)

В агентских рабочих процессах Claude должен «думать» между вызовами инструментов.

Старый режим: для этого требовалось вручную добавлять beta-заголовок, и это не работало в Opus 4.5.

Новый режим: при использовании Adaptive Thinking интерактивное мышление включается автоматически, никаких дополнительных настроек не нужно.

Запрос пользователя → Claude думает → Вызов инструмента A → Claude снова думает → Вызов инструмента B → Итоговый ответ

Это критически важно для Claude Code и других агентских приложений — ИИ может «переосмыслить» ситуацию после каждого шага, что значительно снижает количество ошибок.

Улучшение 3: гибкость в многоходовых диалогах

Старый режим: в многоходовых диалогах сообщение assistant из предыдущего шага обязательно должно было начинаться с блока thinking, иначе возникала ошибка. Это усложняло управление историей чата.

Новый режим: этого ограничения больше нет. Adaptive Thinking гораздо гибче в диалогах, так как Claude может сам решить, что в некоторых репликах размышления не требуются.

Улучшение 4: параметр effort вместо budget_tokens

effort — это сигнал о желаемом поведении, а не жесткое ограничение, что гораздо ближе к реальным задачам.

Уровень Effort Поведение Сценарии использования Поддерживаемые модели
max Всегда глубокие размышления, без ограничений Сложные логические задачи Только Opus 4.6
high (по умолч.) Почти всегда размышляет, глубокий анализ Ревью кода, проектирование Opus 4.6, Sonnet 4.6
medium Средний уровень, простые задачи могут пропускаться Повседневная разработка Opus 4.6, Sonnet 4.6
low Минимальные размышления, приоритет скорости Простые вопросы, проверка стиля Opus 4.6, Sonnet 4.6

Важно: даже при low effort, если вопрос окажется достаточно сложным, Claude все равно включит режим размышлений. effort — это рекомендация, а не приказ.

💡 Совет для Sonnet 4.6: Anthropic рекомендует использовать medium effort по умолчанию для Sonnet 4.6 — это лучший баланс между скоростью, стоимостью и качеством. При вызове через APIYI (apiyi.com) просто добавьте параметр output_config в ваш запрос.

Полное руководство по вызову API

Базовый вызов: простейший Adaptive Thinking

import openai

client = openai.OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com/v1"  # Единый интерфейс APIYI
)

response = client.chat.completions.create(
    model="claude-opus-4-6",
    messages=[
        {"role": "user", "content": "Объясни влияние GIL в Python на многопоточность"}
    ],
    max_tokens=16000,
    extra_body={
        "thinking": {"type": "adaptive"}
    }
)
print(response.choices[0].message.content)

Использование нативного SDK Anthropic

import anthropic

client = anthropic.Anthropic(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com"  # Единый интерфейс APIYI
)

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    messages=[
        {"role": "user", "content": "Проверь этот код на наличие состояний гонки (race conditions)..."}
    ]
)

# Парсинг ответа: может содержать блок thinking и блок text
for block in response.content:
    if block.type == "thinking":
        print(f"[Процесс мышления] {block.thinking}")
    elif block.type == "text":
        print(f"[Ответ] {block.text}")

Тонкая настройка с параметром effort

# Пример для SDK Anthropic
response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    output_config={"effort": "medium"},  # Средняя глубина мышления
    messages=[
        {"role": "user", "content": "Какие проблемы есть в этом коде?"}
    ]
)

Пропуск процесса мышления для снижения задержки

Если вам не нужно видеть ход мыслей, можно использовать display: "omitted", чтобы уменьшить задержку передачи данных:

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={
        "type": "adaptive",
        "display": "omitted"  # Не возвращать текст мышления
    },
    messages=[...]
)
# Примечание: токены мышления все равно будут тарифицироваться
Посмотреть полный пример рабочего процесса проверки кода
import anthropic

client = anthropic.Anthropic(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com"
)

def review_pr(diff_content, risk_level="medium"):
    """Адаптивная проверка кода в зависимости от уровня риска"""

    # Высокий риск: Opus + high effort
    # Низкий риск: Sonnet + medium effort
    if risk_level == "high":
        model = "claude-opus-4-6"
        effort = "high"
    else:
        model = "claude-sonnet-4-6"
        effort = "medium"

    response = client.messages.create(
        model=model,
        max_tokens=16000,
        thinking={"type": "adaptive"},
        output_config={"effort": effort},
        system="""Ты эксперт по проверке кода.
Проанализируй изменения в коде и классифицируй их по уровню серьезности:
🔴 Обязательно к исправлению (безопасность/логика)
🟡 Рекомендуется к исправлению (качество)
💡 Предложения по улучшению""",
        messages=[
            {"role": "user", "content": f"Проверь:\n\n{diff_content}"}
        ]
    )

    thinking_text = ""
    review_text = ""
    for block in response.content:
        if block.type == "thinking":
            thinking_text = block.thinking
        elif block.type == "text":
            review_text = block.text

    return {
        "thinking": thinking_text,
        "review": review_text,
        "model": model,
        "effort": effort,
        "input_tokens": response.usage.input_tokens,
        "output_tokens": response.usage.output_tokens
    }

🚀 Быстрый старт: Вызывайте Claude 4.6 API через APIYI (apiyi.com), просто добавив thinking: {"type": "adaptive"} в запрос. Никаких дополнительных настроек — одна строка кода для апгрейда возможностей рассуждения вашего ИИ.


Практика использования параметра Effort: оптимальные конфигурации для разных задач

Руководство по конфигурации для сценариев

Сценарий Рекомендуемая модель Effort Обоснование
Простые вопросы/перевод Sonnet 4.6 low Глубокие рассуждения не нужны, приоритет скорости
Автодополнение/форматирование кода Sonnet 4.6 low Задачи на сопоставление шаблонов, думать не нужно
Повседневная проверка PR Sonnet 4.6 medium Баланс между скоростью и глубиной проверки
Отладка сложных багов Opus 4.6 high Требуется анализ между файлами
Аудит уязвимостей безопасности Opus 4.6 high Нельзя пропустить критические проблемы
Математические/логические доказательства Opus 4.6 max Требуется максимальная глубина рассуждений
Проектирование архитектуры Opus 4.6 max Нужно всестороннее рассмотрение компромиссов

Использование effort в Claude Code

После обновления Claude Code в марте 2026 года появилась команда /effort:

# Установка напрямую в терминале Claude Code
/effort medium    # Повседневное кодирование
/effort high      # Проверка кода
/effort max       # Архитектурное проектирование (только для Opus 4.6)

Это позволяет разработчикам гибко настраивать глубину мышления Claude под текущую задачу без изменения кода.

💰 Оптимизация затрат: Параметр effort напрямую влияет на потребление токенов. Для повседневных задач кодирования установка medium или low для Sonnet 4.6 может значительно снизить расходы. При использовании платформы APIYI (apiyi.com) цены выгоднее официальных, а использование параметра effort дает двойную экономию.

Переход с Extended Thinking на Adaptive Thinking

Таблица соответствия для миграции

Старый формат (Extended Thinking) Новый формат (Adaptive Thinking)
thinking: {"type": "enabled", "budget_tokens": 5000} thinking: {"type": "adaptive"}, output_config: {"effort": "low"}
thinking: {"type": "enabled", "budget_tokens": 10000} thinking: {"type": "adaptive"}, output_config: {"effort": "medium"}
thinking: {"type": "enabled", "budget_tokens": 30000} thinking: {"type": "adaptive"}, output_config: {"effort": "high"}
thinking: {"type": "enabled", "budget_tokens": 100000} thinking: {"type": "adaptive"}, output_config: {"effort": "max"}
Ручное добавление заголовка interleaved thinking beta Включается автоматически, заголовки не нужны

Важные моменты при миграции

1. Кэширование промптов прерывается

При переключении с режима enabled на adaptive точки останова кэширования промптов (prompt cache) на уровне сообщений перестают работать. Системные промпты и определения инструментов остаются в кэше без изменений.

Совет: лучше переводить все запросы на режим adaptive сразу, а не использовать смешанный подход.

2. Содержимое процесса мышления по умолчанию — это краткая сводка

Модели Claude 4.6 по умолчанию возвращают сводную версию (summary) процесса мышления, а не полный текст. Это значит, что блок thinking, который вы видите, — упрощенный.

  • Сводная версия (display: "summarized"): поведение по умолчанию.
  • Опущенная версия (display: "omitted"): текст мышления не возвращается.
  • Полная версия: доступна только после согласования с отделом продаж Anthropic.

3. Тарификация идет по полному объему мышления

Независимо от того, видите вы сводку или вообще ничего, оплата списывается за весь объем токенов внутреннего процесса мышления. Не думайте, что если текста меньше, то и затраты ниже.

4. Prefill больше не поддерживается

Claude Opus 4.6 больше не поддерживает предварительное заполнение (prefill) сообщений ассистента — при попытке отправить prefill вы получите ошибку 400. Для управления форматом вывода используйте системный промпт или структурированный вывод (structured output).

🎯 Совет по миграции: рекомендую сначала протестировать изменения в тестовой среде, особенно сравнив качество ответов в режиме adaptive с вашими предыдущими настройками budget_tokens. Через сервис-прокси API APIYI (apiyi.com) это делается очень просто — можно проводить A/B тесты, используя один и тот же ключ для разных конфигураций.


claude-adaptive-thinking-mode-api-guide-replace-extended-thinking-ru 图示

Подробный разбор механизма тарификации

Как тарифицируются токены мышления

Понимание того, как работает биллинг, критически важно для контроля расходов.

Статья расходов Описание
Входные токены Стандартная тарификация ($5/млн токенов для Opus, $3/млн для Sonnet)
Токены мышления Тарифицируются по цене выходных токенов ($25/млн для Opus, $15/млн для Sonnet)
Токены текстового ответа Тарифицируются по цене выходных токенов
Токены генерации резюме Дополнительно не тарифицируются
display: "omitted" Токены мышления всё равно тарифицируются, просто не передаются в ответе

Стратегии оптимизации затрат

Простые задачи с low effort → возможен пропуск этапа мышления → экономия большого количества выходных токенов
                                                ↓
                                           Расходы можно снизить на 50-80%

Реальный пример сравнения: задача проверки стиля кода

Конфигурация Токены мышления Токены ответа Общая стоимость (Sonnet)
effort: high ~3000 ~500 ~$0.053
effort: medium ~800 ~500 ~$0.020
effort: low 0 (пропуск мышления) ~500 ~$0.009

Для простых задач уровень low обходится примерно на 83% дешевле, чем high.

💰 Лайфхак для экономии: при пакетной обработке (например, проверка стиля для 100 файлов) установка параметра effort в значение low позволит существенно сократить расходы. Используя APIYI apiyi.com для вызова Claude 4.6 API, вы получаете двойную выгоду: за счет уже сниженных цен и за счет оптимизации параметра effort.


Часто задаваемые вопросы

Q1: Можно ли использовать Adaptive Thinking и Extended Thinking одновременно?

Можно, но не рекомендуется. В моделях Claude 4.6 режим Extended Thinking (type: "enabled") всё ещё доступен, но помечен как устаревший (Deprecated) и будет удален в будущих версиях. Совместное использование этих режимов также приводит к сбросу кэша промптов. Рекомендуем как можно скорее перейти на Adaptive Thinking. При вызове через APIYI apiyi.com формат параметров полностью совместим.

Q2: Поддерживает ли Opus 4.5 Adaptive Thinking?

Нет. Adaptive Thinking поддерживается только в Claude Opus 4.6 и Sonnet 4.6. Для Opus 4.5 по-прежнему нужно использовать режим type: "enabled" и вручную задавать budget_tokens. Если вам нужен Adaptive Thinking, рекомендуем обновиться до моделей серии 4.6. APIYI apiyi.com предоставляет доступ к API всей линейки моделей 4.5 и 4.6.

Q3: Действительно ли display: «omitted» помогает экономить?

Нет, это не экономит деньги. Параметр display: "omitted" лишь отключает передачу текста мышления в ответе API, что снижает сетевую задержку. Однако внутренние токены мышления всё равно генерируются и тарифицируются. Реальный способ сэкономить — это снижение уровня effort: значения low или medium позволяют Claude пропускать или сокращать процесс мышления при решении простых задач.

Q4: Как понять, размышляла ли модель Claude во время конкретного запроса?

Проверьте, содержит ли ответ блок контента типа thinking. Если Claude решит, что размышления не требуются, в ответе будет только блок text без блока thinking. В адаптивном режиме подсчет токенов в поле usage поможет вам определить, сколько токенов было потрачено на процесс мышления.

Q5: Как использовать Adaptive Thinking в Claude Code?

Claude Code автоматически активирует Adaptive Thinking при использовании Opus 4.6 или Sonnet 4.6. Вы можете настроить глубину мышления с помощью команды /effort: /effort low (быстрый режим), /effort medium (сбалансированный режим), /effort high (глубокий режим). Обновление от марта 2026 года также исправило ошибку "adaptive thinking is not supported", возникавшую из-за нестандартных строк моделей.


Резюме: Adaptive Thinking — ключевое обновление Claude 4.6

Adaptive Thinking знаменует собой важный этап в развитии моделей рассуждения ИИ: переход от модели «разработчик угадывает, сколько времени нужно ИИ на раздумья» к модели «ИИ сам решает, сколько ему нужно думать».

4 ключевых обновления:

  1. Динамическое принятие решений: мгновенные ответы на простые вопросы и глубокие рассуждения для сложных задач.
  2. Автоматическое чередование мышления: автоматический запуск процесса рассуждения между вызовами инструментов в агентских рабочих процессах.
  3. Гибкий многоходовый диалог: больше не нужно принудительно начинать с блока thinking.
  4. Параметр effort: более интуитивно понятный способ управления глубиной размышлений по сравнению с budget_tokens.

Советы по миграции: замените thinking: {"type": "enabled", "budget_tokens": N} на thinking: {"type": "adaptive"} и используйте output_config: {"effort": "..."} для контроля глубины рассуждений.

Рекомендуем быстро подключиться к API моделей Claude Opus 4.6 и Sonnet 4.6 через сервис-прокси API APIYI (apiyi.com). Достаточно изменить всего один параметр, чтобы оценить преимущества интеллектуального рассуждения и оптимизации затрат, которые дает Adaptive Thinking.


Справочные материалы

  1. Документация Claude API — Adaptive Thinking: официальное техническое руководство

    • Ссылка: platform.claude.com/docs/en/build-with-claude/adaptive-thinking
  2. Документация Claude API — Параметр Effort: подробное описание конфигурации effort

    • Ссылка: platform.claude.com/docs/en/build-with-claude/effort
  3. Официальный сайт Anthropic — Claude Opus 4.6: анонс выпуска

    • Ссылка: anthropic.com/news/claude-opus-4-6
  4. Документация Claude API — Extended Thinking: руководство по исходному расширенному мышлению

    • Ссылка: platform.claude.com/docs/en/build-with-claude/extended-thinking

Автор: Команда APIYI | Будьте в курсе новейших возможностей API Claude. Посетите APIYI (apiyi.com), чтобы получить доступ к API всей линейки моделей Claude 4.6 и техническую поддержку.

Похожие записи