Claude API | Новости API больших моделей

Разбор адаптивного режима мышления Claude Adaptive Thinking: 4 главных улучшения по сравнению с Extended Thinking

ОтAPIYI - Stable and affordable AI API 2026年 3月 21日

Если вы активно использовали режим Extended Thinking (расширенное мышление) в Claude, обратите внимание: в Claude 4.6 он помечен как Deprecated (устаревший). На смену ему пришел более интеллектуальный режим: Adaptive Thinking (адаптивное мышление).

Главное изменение: раньше вам приходилось вручную задавать бюджет токенов на размышление (budget_tokens), а теперь Claude сам решает, нужно ли ему «думать» и насколько глубоко. Простые вопросы обрабатываются мгновенно, а сложные требуют глубоких рассуждений — и всё это с помощью одного параметра.

Основная ценность: из этой статьи вы узнаете, как использовать API Adaptive Thinking, разберете 4 ключевых обновления, научитесь настраивать параметр effort и получите полное руководство по миграции с Extended Thinking.

Что такое Adaptive Thinking: суть в одном предложении

Extended Thinking (старый режим): вы задаете Claude «бюджет в 10 000 токенов на размышления», и модель тратит их все, независимо от сложности задачи.

Adaptive Thinking (новый режим): Claude самостоятельно оценивает сложность вопроса и решает, «нужно ли думать» и «насколько глубоко погружаться в размышления».

# ❌ Старый режим (Extended Thinking) - скоро будет удален
thinking={"type": "enabled", "budget_tokens": 10000}

# ✅ Новый режим (Adaptive Thinking) - рекомендуется
thinking={"type": "adaptive"}

Краткий обзор ключевых данных

Параметр	Детали
Название функции	Adaptive Thinking (адаптивное мышление)
Дата релиза	5 февраля 2026 г. (вместе с Claude Opus 4.6)
Поддерживаемые модели	Claude Opus 4.6, Claude Sonnet 4.6
API-параметр	`thinking: {"type": "adaptive"}`
Управление	Параметр `effort` (заменяет `budget_tokens`)
Статус	Официальный стандарт (Extended Thinking устарел)
Интерактивное мышление	Включено автоматически (без beta-заголовков)
Claude Code	Поддерживается нативно, настройка через команду `/effort`

🎯 Совет по миграции: Если ваш проект все еще использует Extended Thinking (type: "enabled"), рекомендуем как можно скорее перейти на Adaptive Thinking. При использовании API Claude Opus 4.6 или Sonnet 4.6 через сервис-прокси API APIYI (apiyi.com) для миграции достаточно изменить всего один параметр.

Adaptive vs Extended Thinking: 4 главных улучшения

Улучшение 1: от «фиксированного бюджета» к «динамическому решению»

Это самое фундаментальное изменение.

Проблема старого режима: вам приходилось угадывать значение budget_tokens. Если задать слишком мало — модель не справится со сложной логикой; слишком много — вы просто выбрасываете токены (и деньги) на ветер при простых задачах.

# Старый режим: угадайте, сколько токенов нужно для размышлений?
thinking={"type": "enabled", "budget_tokens": 10000}
# Проблема: даже на простые вопросы тратится много токенов

Новый режим: Claude сам решает, сколько нужно ресурсов, исходя из сложности запроса.

# Новый режим: Claude оценивает сам
thinking={"type": "adaptive"}
# Простые вопросы: модель не думает или думает минимально
# Сложные вопросы: глубокий анализ

Практический эффект: для смешанных рабочих нагрузок (например, ревью кода, где один PR — это правка опечатки, а другой — рефакторинг архитектуры) Adaptive Thinking показывает гораздо более высокую эффективность и экономичность.

Улучшение 2: автоматическое интерактивное мышление (Interleaved Thinking)

В агентских рабочих процессах Claude должен «думать» между вызовами инструментов.

Старый режим: для этого требовалось вручную добавлять beta-заголовок, и это не работало в Opus 4.5.

Новый режим: при использовании Adaptive Thinking интерактивное мышление включается автоматически, никаких дополнительных настроек не нужно.

Запрос пользователя → Claude думает → Вызов инструмента A → Claude снова думает → Вызов инструмента B → Итоговый ответ

Это критически важно для Claude Code и других агентских приложений — ИИ может «переосмыслить» ситуацию после каждого шага, что значительно снижает количество ошибок.

Улучшение 3: гибкость в многоходовых диалогах

Старый режим: в многоходовых диалогах сообщение assistant из предыдущего шага обязательно должно было начинаться с блока thinking, иначе возникала ошибка. Это усложняло управление историей чата.

Новый режим: этого ограничения больше нет. Adaptive Thinking гораздо гибче в диалогах, так как Claude может сам решить, что в некоторых репликах размышления не требуются.

Улучшение 4: параметр `effort` вместо `budget_tokens`

effort — это сигнал о желаемом поведении, а не жесткое ограничение, что гораздо ближе к реальным задачам.

Уровень Effort	Поведение	Сценарии использования	Поддерживаемые модели
`max`	Всегда глубокие размышления, без ограничений	Сложные логические задачи	Только Opus 4.6
`high` (по умолч.)	Почти всегда размышляет, глубокий анализ	Ревью кода, проектирование	Opus 4.6, Sonnet 4.6
`medium`	Средний уровень, простые задачи могут пропускаться	Повседневная разработка	Opus 4.6, Sonnet 4.6
`low`	Минимальные размышления, приоритет скорости	Простые вопросы, проверка стиля	Opus 4.6, Sonnet 4.6

Важно: даже при low effort, если вопрос окажется достаточно сложным, Claude все равно включит режим размышлений. effort — это рекомендация, а не приказ.

💡 Совет для Sonnet 4.6: Anthropic рекомендует использовать medium effort по умолчанию для Sonnet 4.6 — это лучший баланс между скоростью, стоимостью и качеством. При вызове через APIYI (apiyi.com) просто добавьте параметр output_config в ваш запрос.

Полное руководство по вызову API

Базовый вызов: простейший Adaptive Thinking

import openai

client = openai.OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com/v1"  # Единый интерфейс APIYI
)

response = client.chat.completions.create(
    model="claude-opus-4-6",
    messages=[
        {"role": "user", "content": "Объясни влияние GIL в Python на многопоточность"}
    ],
    max_tokens=16000,
    extra_body={
        "thinking": {"type": "adaptive"}
    }
)
print(response.choices[0].message.content)

Использование нативного SDK Anthropic

import anthropic

client = anthropic.Anthropic(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com"  # Единый интерфейс APIYI
)

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    messages=[
        {"role": "user", "content": "Проверь этот код на наличие состояний гонки (race conditions)..."}
    ]
)

# Парсинг ответа: может содержать блок thinking и блок text
for block in response.content:
    if block.type == "thinking":
        print(f"[Процесс мышления] {block.thinking}")
    elif block.type == "text":
        print(f"[Ответ] {block.text}")

Тонкая настройка с параметром effort

# Пример для SDK Anthropic
response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    output_config={"effort": "medium"},  # Средняя глубина мышления
    messages=[
        {"role": "user", "content": "Какие проблемы есть в этом коде?"}
    ]
)

Пропуск процесса мышления для снижения задержки

Если вам не нужно видеть ход мыслей, можно использовать display: "omitted", чтобы уменьшить задержку передачи данных:

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={
        "type": "adaptive",
        "display": "omitted"  # Не возвращать текст мышления
    },
    messages=[...]
)
# Примечание: токены мышления все равно будут тарифицироваться

Посмотреть полный пример рабочего процесса проверки кода

import anthropic

client = anthropic.Anthropic(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com"
)

def review_pr(diff_content, risk_level="medium"):
    """Адаптивная проверка кода в зависимости от уровня риска"""

    # Высокий риск: Opus + high effort
    # Низкий риск: Sonnet + medium effort
    if risk_level == "high":
        model = "claude-opus-4-6"
        effort = "high"
    else:
        model = "claude-sonnet-4-6"
        effort = "medium"

    response = client.messages.create(
        model=model,
        max_tokens=16000,
        thinking={"type": "adaptive"},
        output_config={"effort": effort},
        system="""Ты эксперт по проверке кода.
Проанализируй изменения в коде и классифицируй их по уровню серьезности:
🔴 Обязательно к исправлению (безопасность/логика)
🟡 Рекомендуется к исправлению (качество)
💡 Предложения по улучшению""",
        messages=[
            {"role": "user", "content": f"Проверь:\n\n{diff_content}"}
        ]
    )

    thinking_text = ""
    review_text = ""
    for block in response.content:
        if block.type == "thinking":
            thinking_text = block.thinking
        elif block.type == "text":
            review_text = block.text

    return {
        "thinking": thinking_text,
        "review": review_text,
        "model": model,
        "effort": effort,
        "input_tokens": response.usage.input_tokens,
        "output_tokens": response.usage.output_tokens
    }

🚀 Быстрый старт: Вызывайте Claude 4.6 API через APIYI (apiyi.com), просто добавив thinking: {"type": "adaptive"} в запрос. Никаких дополнительных настроек — одна строка кода для апгрейда возможностей рассуждения вашего ИИ.

Практика использования параметра Effort: оптимальные конфигурации для разных задач

Руководство по конфигурации для сценариев

Сценарий	Рекомендуемая модель	Effort	Обоснование
Простые вопросы/перевод	Sonnet 4.6	`low`	Глубокие рассуждения не нужны, приоритет скорости
Автодополнение/форматирование кода	Sonnet 4.6	`low`	Задачи на сопоставление шаблонов, думать не нужно
Повседневная проверка PR	Sonnet 4.6	`medium`	Баланс между скоростью и глубиной проверки
Отладка сложных багов	Opus 4.6	`high`	Требуется анализ между файлами
Аудит уязвимостей безопасности	Opus 4.6	`high`	Нельзя пропустить критические проблемы
Математические/логические доказательства	Opus 4.6	`max`	Требуется максимальная глубина рассуждений
Проектирование архитектуры	Opus 4.6	`max`	Нужно всестороннее рассмотрение компромиссов

Использование effort в Claude Code

После обновления Claude Code в марте 2026 года появилась команда /effort:

# Установка напрямую в терминале Claude Code
/effort medium    # Повседневное кодирование
/effort high      # Проверка кода
/effort max       # Архитектурное проектирование (только для Opus 4.6)

Это позволяет разработчикам гибко настраивать глубину мышления Claude под текущую задачу без изменения кода.

💰 Оптимизация затрат: Параметр effort напрямую влияет на потребление токенов. Для повседневных задач кодирования установка medium или low для Sonnet 4.6 может значительно снизить расходы. При использовании платформы APIYI (apiyi.com) цены выгоднее официальных, а использование параметра effort дает двойную экономию.

Переход с Extended Thinking на Adaptive Thinking

Таблица соответствия для миграции

Старый формат (Extended Thinking)	Новый формат (Adaptive Thinking)
`thinking: {"type": "enabled", "budget_tokens": 5000}`	`thinking: {"type": "adaptive"}, output_config: {"effort": "low"}`
`thinking: {"type": "enabled", "budget_tokens": 10000}`	`thinking: {"type": "adaptive"}, output_config: {"effort": "medium"}`
`thinking: {"type": "enabled", "budget_tokens": 30000}`	`thinking: {"type": "adaptive"}, output_config: {"effort": "high"}`
`thinking: {"type": "enabled", "budget_tokens": 100000}`	`thinking: {"type": "adaptive"}, output_config: {"effort": "max"}`
Ручное добавление заголовка interleaved thinking beta	Включается автоматически, заголовки не нужны

Важные моменты при миграции

1. Кэширование промптов прерывается

При переключении с режима enabled на adaptive точки останова кэширования промптов (prompt cache) на уровне сообщений перестают работать. Системные промпты и определения инструментов остаются в кэше без изменений.

Совет: лучше переводить все запросы на режим adaptive сразу, а не использовать смешанный подход.

2. Содержимое процесса мышления по умолчанию — это краткая сводка

Модели Claude 4.6 по умолчанию возвращают сводную версию (summary) процесса мышления, а не полный текст. Это значит, что блок thinking, который вы видите, — упрощенный.

Сводная версия (display: "summarized"): поведение по умолчанию.
Опущенная версия (display: "omitted"): текст мышления не возвращается.
Полная версия: доступна только после согласования с отделом продаж Anthropic.

3. Тарификация идет по полному объему мышления

Независимо от того, видите вы сводку или вообще ничего, оплата списывается за весь объем токенов внутреннего процесса мышления. Не думайте, что если текста меньше, то и затраты ниже.

4. Prefill больше не поддерживается

Claude Opus 4.6 больше не поддерживает предварительное заполнение (prefill) сообщений ассистента — при попытке отправить prefill вы получите ошибку 400. Для управления форматом вывода используйте системный промпт или структурированный вывод (structured output).

🎯 Совет по миграции: рекомендую сначала протестировать изменения в тестовой среде, особенно сравнив качество ответов в режиме adaptive с вашими предыдущими настройками budget_tokens. Через сервис-прокси API APIYI (apiyi.com) это делается очень просто — можно проводить A/B тесты, используя один и тот же ключ для разных конфигураций.

Подробный разбор механизма тарификации

Как тарифицируются токены мышления

Понимание того, как работает биллинг, критически важно для контроля расходов.

Статья расходов	Описание
Входные токены	Стандартная тарификация ($5/млн токенов для Opus, $3/млн для Sonnet)
Токены мышления	Тарифицируются по цене выходных токенов ($25/млн для Opus, $15/млн для Sonnet)
Токены текстового ответа	Тарифицируются по цене выходных токенов
Токены генерации резюме	Дополнительно не тарифицируются
display: "omitted"	Токены мышления всё равно тарифицируются, просто не передаются в ответе

Стратегии оптимизации затрат

Простые задачи с low effort → возможен пропуск этапа мышления → экономия большого количества выходных токенов
                                                ↓
                                           Расходы можно снизить на 50-80%

Реальный пример сравнения: задача проверки стиля кода

Конфигурация	Токены мышления	Токены ответа	Общая стоимость (Sonnet)
effort: high	~3000	~500	~$0.053
effort: medium	~800	~500	~$0.020
effort: low	0 (пропуск мышления)	~500	~$0.009

Для простых задач уровень low обходится примерно на 83% дешевле, чем high.

💰 Лайфхак для экономии: при пакетной обработке (например, проверка стиля для 100 файлов) установка параметра effort в значение low позволит существенно сократить расходы. Используя APIYI apiyi.com для вызова Claude 4.6 API, вы получаете двойную выгоду: за счет уже сниженных цен и за счет оптимизации параметра effort.

Часто задаваемые вопросы

Q1: Можно ли использовать Adaptive Thinking и Extended Thinking одновременно?

Можно, но не рекомендуется. В моделях Claude 4.6 режим Extended Thinking (type: "enabled") всё ещё доступен, но помечен как устаревший (Deprecated) и будет удален в будущих версиях. Совместное использование этих режимов также приводит к сбросу кэша промптов. Рекомендуем как можно скорее перейти на Adaptive Thinking. При вызове через APIYI apiyi.com формат параметров полностью совместим.

Q2: Поддерживает ли Opus 4.5 Adaptive Thinking?

Нет. Adaptive Thinking поддерживается только в Claude Opus 4.6 и Sonnet 4.6. Для Opus 4.5 по-прежнему нужно использовать режим type: "enabled" и вручную задавать budget_tokens. Если вам нужен Adaptive Thinking, рекомендуем обновиться до моделей серии 4.6. APIYI apiyi.com предоставляет доступ к API всей линейки моделей 4.5 и 4.6.

Q3: Действительно ли display: «omitted» помогает экономить?

Нет, это не экономит деньги. Параметр display: "omitted" лишь отключает передачу текста мышления в ответе API, что снижает сетевую задержку. Однако внутренние токены мышления всё равно генерируются и тарифицируются. Реальный способ сэкономить — это снижение уровня effort: значения low или medium позволяют Claude пропускать или сокращать процесс мышления при решении простых задач.

Q4: Как понять, размышляла ли модель Claude во время конкретного запроса?

Проверьте, содержит ли ответ блок контента типа thinking. Если Claude решит, что размышления не требуются, в ответе будет только блок text без блока thinking. В адаптивном режиме подсчет токенов в поле usage поможет вам определить, сколько токенов было потрачено на процесс мышления.

Q5: Как использовать Adaptive Thinking в Claude Code?

Claude Code автоматически активирует Adaptive Thinking при использовании Opus 4.6 или Sonnet 4.6. Вы можете настроить глубину мышления с помощью команды /effort: /effort low (быстрый режим), /effort medium (сбалансированный режим), /effort high (глубокий режим). Обновление от марта 2026 года также исправило ошибку "adaptive thinking is not supported", возникавшую из-за нестандартных строк моделей.

Резюме: Adaptive Thinking — ключевое обновление Claude 4.6

Adaptive Thinking знаменует собой важный этап в развитии моделей рассуждения ИИ: переход от модели «разработчик угадывает, сколько времени нужно ИИ на раздумья» к модели «ИИ сам решает, сколько ему нужно думать».

4 ключевых обновления:

Динамическое принятие решений: мгновенные ответы на простые вопросы и глубокие рассуждения для сложных задач.
Автоматическое чередование мышления: автоматический запуск процесса рассуждения между вызовами инструментов в агентских рабочих процессах.
Гибкий многоходовый диалог: больше не нужно принудительно начинать с блока thinking.
Параметр effort: более интуитивно понятный способ управления глубиной размышлений по сравнению с budget_tokens.

Советы по миграции: замените thinking: {"type": "enabled", "budget_tokens": N} на thinking: {"type": "adaptive"} и используйте output_config: {"effort": "..."} для контроля глубины рассуждений.

Рекомендуем быстро подключиться к API моделей Claude Opus 4.6 и Sonnet 4.6 через сервис-прокси API APIYI (apiyi.com). Достаточно изменить всего один параметр, чтобы оценить преимущества интеллектуального рассуждения и оптимизации затрат, которые дает Adaptive Thinking.

Справочные материалы

Документация Claude API — Adaptive Thinking: официальное техническое руководство
- Ссылка: platform.claude.com/docs/en/build-with-claude/adaptive-thinking
Документация Claude API — Параметр Effort: подробное описание конфигурации effort
- Ссылка: platform.claude.com/docs/en/build-with-claude/effort
Официальный сайт Anthropic — Claude Opus 4.6: анонс выпуска
- Ссылка: anthropic.com/news/claude-opus-4-6
Документация Claude API — Extended Thinking: руководство по исходному расширенному мышлению
- Ссылка: platform.claude.com/docs/en/build-with-claude/extended-thinking

Автор: Команда APIYI | Будьте в курсе новейших возможностей API Claude. Посетите APIYI (apiyi.com), чтобы получить доступ к API всей линейки моделей Claude 4.6 и техническую поддержку.

APIYI - Stable and affordable AI API

Try AI Large Model https://api.apiyi.com for free
Stable and reliable AI LM API aggregation service, Get 300 Millions Tokens for Free~

Новости API больших моделей

Обзор трех новых моделей Microsoft MAI: технические характеристики и API-подключение для MAI-Transcribe-1, MAI-Voice-1 и MAI-Image-2
ОтAPIYI - Stable and affordable AI API 2026年 4月 7日

2 апреля 2026 года команда Microsoft MAI Super Intelligence официально представила 3 собственные базовые модели: MAI-Transcribe-1 (распознавание речи), MAI-Voice-1 (генерация речи) и MAI-Image-2 (текст-в-изображение). Это первый крупный релиз продуктов с момента формирования команды MAI под руководством Мустафы Сулеймана, что знаменует начало пути Microsoft к созданию возможностей ИИ-моделей, независимых от OpenAI. Ключевая ценность: за 3 минуты…

Читайте далее Обзор трех новых моделей Microsoft MAI: технические характеристики и API-подключение для MAI-Transcribe-1, MAI-Voice-1 и MAI-Image-2
Новости API больших моделей | Руководство по миграции

Обзор Nano Banana 2: стоит ли использовать? 5 ключевых показателей: цена от $0,03 и скорость в 3 раза выше
ОтAPIYI - Stable and affordable AI API 2026年 2月 27日

Стоит ли использовать Nano Banana 2? Это самая обсуждаемая тема среди разработчиков после выхода Gemini 3.1 Flash Image 26 февраля 2026 года. Ответ однозначный: да, и еще как стоит. Цена в два раза ниже, чем у Nano Banana Pro, скорость в 2-3 раза выше, первое место в рейтинге генерации изображений (текст-в-изображение) от Artificial Analysis. Единственный…

Читайте далее Обзор Nano Banana 2: стоит ли использовать? 5 ключевых показателей: цена от $0,03 и скорость в 3 раза выше
AI-программирование | Новости API больших моделей

Глубокий разбор Claude Mythos Preview: 5 ключевых возможностей самой мощной большой языковой модели от Anthropic
ОтAPIYI - Stable and affordable AI API 2026年 4月 8日

7 апреля 2026 года компания Anthropic тихо представила свою самую мощную на сегодняшний день модель — Claude Mythos Preview, однако доступ к ней для широкой публики закрыт. В этой статье мы кратко разберем, как это событие повлияет на индустрию ИИ и сферу кибербезопасности. Ключевая ценность: за 3 минуты вы узнаете основную информацию о Claude Mythos…

Читайте далее Глубокий разбор Claude Mythos Preview: 5 ключевых возможностей самой мощной большой языковой модели от Anthropic
Claude API | Новости API больших моделей

Claude Opus 4.7 против 4.6: полный сравнительный анализ, 7 ключевых обновлений, неизменная цена при изменении стоимости и руководство по миграции без ошибок
ОтAPIYI - Stable and affordable AI API 2026年 4月 17日

title: "Claude Opus 4.7 vs 4.6: Полный разбор обновлений" description: "Разбираем 7 ключевых отличий Claude Opus 4.7 от 4.6: от 3-кратного улучшения визуальных возможностей до нюансов нового токенизатора и реальной стоимости вызовов." Примечание автора: Подробный сравнительный анализ 7 ключевых различий между Claude Opus 4.7 и 4.6, включая 3-кратное улучшение визуальных возможностей, скачок в навыках кодинга,…

Читайте далее Claude Opus 4.7 против 4.6: полный сравнительный анализ, 7 ключевых обновлений, неизменная цена при изменении стоимости и руководство по миграции без ошибок
История изменений | Новости API больших моделей

Разбор 5 причин, стоящих за релизом GPT-5.4: от GPT-5.3 Instant до тройки лидеров в сфере ИИ
ОтAPIYI - Stable and affordable AI API 2026年 3月 6日

Примечание автора: Глубокий анализ причин выхода GPT-5.4 всего через 2 дня после запуска GPT-5.3 Instant. Разбор конкурентной борьбы между OpenAI, Anthropic и Google, а также уникального позиционирования GPT-5.4. 3 марта OpenAI выпустила GPT-5.3 Instant. И всего через 2 дня, 5 марта, GPT-5.4 официально вышла в свет. Одна компания, две ключевые модели за 3 дня —…

Читайте далее Разбор 5 причин, стоящих за релизом GPT-5.4: от GPT-5.3 Instant до тройки лидеров в сфере ИИ
AI-программирование | Claude API

Полное сравнение Claude Max с ежемесячной подпиской и API с оплатой по факту: 3 стратегии экономии 94% расходов
ОтAPIYI - Stable and affordable AI API 2026年 3月 30日

Claude API с оплатой по факту использования может обойтись в 3000 долларов в месяц, в то время как ваш коллега, использующий подписку Claude Max, платит всего 200 долларов за тот же объем работы. Это не шутка, а реальный опыт многих активных пользователей Claude Code. В этой статье мы подробно сравним реальные затраты на подписку Claude…

Читайте далее Полное сравнение Claude Max с ежемесячной подпиской и API с оплатой по факту: 3 стратегии экономии 94% расходов