Si has estado usando el modo Extended Thinking (Pensamiento Extendido) de Claude, atención: en Claude 4.6 ha sido marcado como Deprecated (próximamente en desuso). Lo reemplaza un modo más inteligente: Adaptive Thinking (Pensamiento Adaptativo).
Cambio central: antes necesitabas configurar manualmente el presupuesto de tokens de pensamiento (budget_tokens). Ahora Claude decide por sí mismo si necesita pensar y qué tan profundo debe hacerlo. Preguntas simples se responden al instante, problemas complejos se analizan en profundidad: todo con un solo parámetro.
Valor central: Al leer este artículo, dominarás el método de llamada a la API de Adaptive Thinking, los 4 detalles principales de su actualización, la configuración del parámetro effort y la guía completa para migrar desde Extended Thinking.

¿Qué es Adaptive Thinking? Comprensión en una frase
Extended Thinking (modo antiguo): El desarrollador le dice a Claude "tienes un presupuesto de 10000 tokens para pensar", y Claude los usa todos.
Adaptive Thinking (modo nuevo): Claude evalúa por sí mismo la complejidad del problema y decide "si necesita pensar" y "qué tan profundo debe pensar".
# ❌ Modo antiguo (Extended Thinking) - Próximamente en desuso
thinking={"type": "enabled", "budget_tokens": 10000}
# ✅ Modo nuevo (Adaptive Thinking) - Recomendado
thinking={"type": "adaptive"}
Información central de un vistazo
| Elemento de información | Detalles |
|---|---|
| Nombre de la función | Adaptive Thinking (Pensamiento Adaptativo) |
| Fecha de lanzamiento | 5 de febrero de 2026 (lanzado con Claude Opus 4.6) |
| Modelos compatibles | Claude Opus 4.6, Claude Sonnet 4.6 |
| Parámetro de API | thinking: {"type": "adaptive"} |
| Método de control | Parámetro effort (reemplaza a budget_tokens) |
| Estado | Método oficial recomendado (Extended Thinking está Deprecated) |
| Pensamiento entrelazado | Activado automáticamente (sin necesidad de cabecera beta) |
| Claude Code | Compatibilidad nativa, se puede ajustar con el comando /effort |
🎯 Recomendación de migración: Si tu proyecto está usando Extended Thinking (
type: "enabled"), se recomienda migrar a Adaptive Thinking lo antes posible. A través de la plataforma APIYI apiyi.com para llamar a la API de Claude Opus 4.6 o Sonnet 4.6, solo necesitas modificar un parámetro para completar la migración.
Pensamiento Adaptativo vs Extendido: 4 Mejoras Clave

Mejora Uno: De "Presupuesto Fijo" a "Decisión Dinámica"
Este es el cambio más fundamental.
Dolor del modo antiguo: Tenías que adivinar un valor para budget_tokens. Si lo ponías muy bajo, los problemas complejos no se razonaban lo suficiente; si lo ponías muy alto, los problemas simples desperdiciaban tokens (y dinero).
# Modo antiguo: ¿Cuántos tokens de pensamiento necesita este problema?
thinking={"type": "enabled", "budget_tokens": 10000}
# Problema: Los problemas simples también consumen muchos tokens de pensamiento
Nuevo modo: Claude decide automáticamente según la complejidad de cada solicitud.
# Nuevo modo: Claude lo juzga por sí mismo
thinking={"type": "adaptive"}
# Problema simple: Sin pensamiento o pensamiento ligero
# Problema complejo: Razonamiento profundo
Impacto real: Para cargas de trabajo mixtas que "a veces son simples y a veces complejas" (como en la revisión de código, donde algunos PRs solo cambian texto y otros implican refactorización de concurrencia), el Pensamiento Adaptativo supera al presupuesto fijo tanto en rendimiento general como en eficiencia de costos.
Mejora Dos: Pensamiento Intercalado Automático (Interleaved Thinking)
En flujos de trabajo de tipo agente (Agentic), Claude necesita pensar entre múltiples llamadas a herramientas.
Modo antiguo: El pensamiento intercalado requería añadir manualmente un encabezado beta y no estaba disponible en Opus 4.5.
Nuevo modo: Al usar Pensamiento Adaptativo, el pensamiento intercalado se habilita automáticamente, sin necesidad de configuración adicional.
Solicitud del usuario → Claude piensa → Llama a la herramienta A → Claude piensa de nuevo → Llama a la herramienta B → Respuesta final
Esto es especialmente importante para Claude Code y otras aplicaciones de tipo agente: la IA puede "repensar" después de cada llamada a una herramienta, reduciendo significativamente los errores.
Mejora Tres: Conversaciones Multiturno Más Flexibles
Modo antiguo: En conversaciones multiturno, el mensaje del asistente de la ronda anterior debía comenzar con un bloque de pensamiento, de lo contrario daba error. Esto complicaba la gestión de la conversación.
Nuevo modo: No hay esa limitación. El Pensamiento Adaptativo es más flexible en conversaciones multiturno, porque en algunas rondas Claude puede elegir no pensar.
Mejora Cuatro: El parámetro effort reemplaza a budget_tokens
effort es una señal de comportamiento, no un límite rígido, y se ajusta mejor a las necesidades reales que budget_tokens.
| Nivel de Effort | Comportamiento | Caso de uso | Modelos que lo soportan |
|---|---|---|---|
max |
Siempre piensa en profundidad, sin restricciones | Razonamiento de máxima dificultad | Solo Opus 4.6 |
high (por defecto) |
Casi siempre piensa, razona en profundidad en problemas complejos | Revisión de código, diseño de arquitectura | Opus 4.6, Sonnet 4.6 |
medium |
Pensamiento moderado, puede saltarse problemas simples | Desarrollo diario, tareas generales | Opus 4.6, Sonnet 4.6 |
low |
Minimiza el pensamiento, prioriza la velocidad | Preguntas y respuestas simples, revisión de estilo | Opus 4.6, Sonnet 4.6 |
Importante: Incluso con low effort, si el problema es lo suficientemente complejo, Claude aún puede elegir pensar. El effort es una sugerencia, no una orden.
💡 Recomendación para Sonnet 4.6: Anthropic recomienda oficialmente usar
mediumeffort por defecto en Sonnet 4.6 para lograr el mejor equilibrio entre velocidad, costo y calidad. Al invocarlo a través de APIYI en apiyi.com, solo necesitas incluir el parámetrooutput_configen la solicitud.
Guía completa de invocación de API
Invocación básica: Adaptive Thinking más simple
import openai
client = openai.OpenAI(
api_key="YOUR_API_KEY",
base_url="https://api.apiyi.com/v1" # Endpoint unificado de APIYI
)
response = client.chat.completions.create(
model="claude-opus-4-6",
messages=[
{"role": "user", "content": "Explica el impacto del GIL de Python en la programación multihilo"}
],
max_tokens=16000,
extra_body={
"thinking": {"type": "adaptive"}
}
)
print(response.choices[0].message.content)
Usando el SDK nativo de Anthropic
import anthropic
client = anthropic.Anthropic(
api_key="YOUR_API_KEY",
base_url="https://api.apiyi.com" # Endpoint unificado de APIYI
)
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=16000,
thinking={"type": "adaptive"},
messages=[
{"role": "user", "content": "Revisa este código en busca de condiciones de carrera..."}
]
)
# Analizar la respuesta: puede contener bloques de pensamiento y texto
for block in response.content:
if block.type == "thinking":
print(f"[Proceso de pensamiento] {block.thinking}")
elif block.type == "text":
print(f"[Respuesta] {block.text}")
Control fino con el parámetro effort
# Ejemplo con SDK de Anthropic
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=16000,
thinking={"type": "adaptive"},
output_config={"effort": "medium"}, # Profundidad de pensamiento media
messages=[
{"role": "user", "content": "¿Qué problemas tiene este código?"}
]
)
Omitir el contenido del pensamiento para reducir la latencia
Si no necesitas ver el proceso de pensamiento, puedes usar display: "omitted" para reducir la latencia de transmisión:
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=16000,
thinking={
"type": "adaptive",
"display": "omitted" # No devuelve el texto del pensamiento
},
messages=[...]
)
# Nota: Los tokens de pensamiento seguirán siendo facturados
Ver ejemplo completo de flujo de trabajo de revisión de código
import anthropic
client = anthropic.Anthropic(
api_key="YOUR_API_KEY",
base_url="https://api.apiyi.com"
)
def review_pr(diff_content, risk_level="medium"):
"""Revisa código de forma adaptativa según el nivel de riesgo"""
# Alto riesgo: Opus + high effort
# Bajo riesgo: Sonnet + medium effort
if risk_level == "high":
model = "claude-opus-4-6"
effort = "high"
else:
model = "claude-sonnet-4-6"
effort = "medium"
response = client.messages.create(
model=model,
max_tokens=16000,
thinking={"type": "adaptive"},
output_config={"effort": effort},
system="""Eres un experto senior en revisión de código.
Analiza los cambios de código y clasifícalos por nivel de gravedad:
🔴 Debe corregirse (seguridad/lógica)
🟡 Se recomienda corregir (calidad)
💡 Sugerencia de mejora""",
messages=[
{"role": "user", "content": f"Revisa:\n\n{diff_content}"}
]
)
thinking_text = ""
review_text = ""
for block in response.content:
if block.type == "thinking":
thinking_text = block.thinking
elif block.type == "text":
review_text = block.text
return {
"thinking": thinking_text,
"review": review_text,
"model": model,
"effort": effort,
"input_tokens": response.usage.input_tokens,
"output_tokens": response.usage.output_tokens
}
🚀 Inicio rápido: Para invocar la API de Claude 4.6 a través de APIYI apiyi.com, solo necesitas agregar
thinking: {"type": "adaptive"}a tu solicitud para habilitar el pensamiento adaptativo. Sin configuración adicional, mejora la capacidad de razonamiento de tu IA con una sola línea de código.
Práctica con el parámetro Effort: Configuraciones óptimas para diferentes escenarios
Guía de configuración por escenario
| Escenario | Modelo recomendado | Effort | Razón |
|---|---|---|---|
| Preguntas/Respuestas simples / Traducción | Sonnet 4.6 | low |
No requiere razonamiento profundo, prioriza velocidad |
| Completado de código / Formateo | Sonnet 4.6 | low |
Tarea de coincidencia de patrones, no necesita pensar |
| Revisión diaria de PR | Sonnet 4.6 | medium |
Equilibrio entre velocidad y profundidad de revisión |
| Depuración de bugs complejos | Opus 4.6 | high |
Requiere razonamiento entre archivos |
| Auditoría de vulnerabilidades de seguridad | Opus 4.6 | high |
No se pueden pasar por alto problemas de alto riesgo |
| Demostraciones matemáticas/lógicas | Opus 4.6 | max |
Requiere profundidad de razonamiento extrema |
| Diseño de soluciones de arquitectura | Opus 4.6 | max |
Requiere considerar compensaciones de manera integral |
Usar effort en Claude Code
Después de la actualización de marzo de 2026, Claude Code agregó el comando /effort:
# Configurar directamente en la terminal de Claude Code
/effort medium # Codificación diaria
/effort high # Revisión de código
/effort max # Diseño de arquitectura (solo Opus 4.6)
Esto permite a los desarrolladores ajustar la profundidad de pensamiento de Claude según la tarea actual, sin necesidad de modificar el código.
💰 Optimización de costos: El parámetro effort afecta directamente el consumo de tokens. Para tareas de codificación diarias, configurar Sonnet 4.6 en
mediumolowpuede reducir significativamente los costos. Al invocar a través de la plataforma APIYI apiyi.com, el precio es más económico que el oficial, combinado con el parámetro effort para ahorrar dinero doblemente.
Migración de Extended Thinking a Adaptive Thinking
Tabla de migración
| Escritura antigua (Extended Thinking) | Escritura nueva (Adaptive Thinking) |
|---|---|
thinking: {"type": "enabled", "budget_tokens": 5000} |
thinking: {"type": "adaptive"}, output_config: {"effort": "low"} |
thinking: {"type": "enabled", "budget_tokens": 10000} |
thinking: {"type": "adaptive"}, output_config: {"effort": "medium"} |
thinking: {"type": "enabled", "budget_tokens": 30000} |
thinking: {"type": "adaptive"}, output_config: {"effort": "high"} |
thinking: {"type": "enabled", "budget_tokens": 100000} |
thinking: {"type": "adaptive"}, output_config: {"effort": "max"} |
Agregar manualmente el header interleaved thinking beta |
Se habilita automáticamente, no requiere ningún header |
Consideraciones para la migración
1. La caché de prompt se interrumpirá
Al cambiar del modo enabled a adaptive, los puntos de interrupción de la caché de prompt a nivel de mensaje dejarán de funcionar. La caché de las definiciones del sistema y las herramientas no se ve afectada.
Recomendación: Migra todas las solicitudes al modo adaptive de una vez, en lugar de usar una combinación.
2. El contenido del pensamiento es un resumen por defecto
El modelo Claude 4.6 devuelve por defecto una versión resumida del contenido del pensamiento, no el texto completo. Esto significa que el bloque de pensamiento que ves es una versión simplificada.
- Versión resumida (
display: "summarized"): Comportamiento por defecto - Versión omitida (
display: "omitted"): No devuelve texto de pensamiento - Versión completa: Requiere contactar al equipo de ventas de Anthropic para habilitarlo
3. La facturación se basa en el pensamiento completo
Ya sea que veas un resumen o se omita, la facturación se calcula según la cantidad de tokens del pensamiento interno completo. No asumas que el costo es menor solo porque ves menos texto.
4. Prefill ya no es compatible
Claude Opus 4.6 ya no admite el prellenado (prefill) de mensajes del asistente: enviar un prefill devolverá un error 400. Si necesitas controlar el formato de salida, utiliza el prompt del sistema o structured output.
🎯 Recomendación de migración: Se recomienda verificar primero el efecto de la migración en un entorno de prueba, especialmente comparando las diferencias en la calidad de salida entre el modo adaptive y los
budget_tokensfijos anteriores. A través de APIYI apiyi.com puedes realizar fácilmente pruebas A/B: una misma clave para llamar a diferentes configuraciones.

Detalles del mecanismo de facturación
Cómo se facturan los tokens de pensamiento
Comprender el mecanismo de facturación es crucial para controlar los costos.
| Concepto facturable | Explicación |
|---|---|
| Tokens de entrada | Facturación normal ($5/MTok Opus, $3/MTok Sonnet) |
| Tokens de pensamiento | Se facturan al precio de los tokens de salida ($25/MTok Opus, $15/MTok Sonnet) |
| Tokens de texto de respuesta | Se facturan al precio de los tokens de salida |
| Tokens de generación de resumen | No se facturan adicionalmente |
| display: "omitted" | Los tokens de pensamiento aún se facturan, solo que no se transmiten |
Estrategias de optimización de costos
Problemas simples con low effort → Puede omitir el pensamiento → Ahorra muchos tokens de salida
↓
Costos pueden bajar 50-80%
Ejemplo de comparación real: La misma tarea de revisión de estilo de código
| Configuración | Tokens de pensamiento | Tokens de respuesta | Costo total (Sonnet) |
|---|---|---|---|
| effort: high | ~3000 | ~500 | ~$0.053 |
| effort: medium | ~800 | ~500 | ~$0.020 |
| effort: low | 0 (omite pensamiento) | ~500 | ~$0.009 |
Para tareas simples, low effort es aproximadamente un 83% más barato que high effort.
💰 Truco para ahorrar: Para escenarios de procesamiento por lotes (por ejemplo, revisar el estilo de 100 archivos), configurar effort a
lowpuede ahorrar costos significativos. Al invocar la API de Claude 4.6 a través de APIYI apiyi.com, puedes combinar los precios promocionales existentes con la optimización del parámetro effort para un doble ahorro.
Preguntas frecuentes
P1: ¿Se pueden mezclar Adaptive Thinking y Extended Thinking?
Sí, pero no se recomienda. En el modelo Claude 4.6, Extended Thinking (type: "enabled") sigue disponible pero está marcado como Deprecated y se eliminará en versiones futuras. Mezclar ambos modos también provoca que se pierdan los puntos de interrupción de la caché de prompts. Se recomienda migrar lo antes posible a Adaptive Thinking de manera uniforme. Al invocar a través de APIYI apiyi.com, el formato de los parámetros es completamente compatible.
P2: ¿Opus 4.5 soporta Adaptive Thinking?
No. Adaptive Thinking solo es compatible con Claude Opus 4.6 y Sonnet 4.6. Opus 4.5 aún requiere usar el modo type: "enabled" y configurar manualmente budget_tokens. Si necesitas usar Adaptive Thinking, se recomienda actualizar a la serie de modelos 4.6. APIYI apiyi.com proporciona acceso API para toda la serie de modelos 4.5 y 4.6.
P3: ¿display: «omitted» realmente ahorra dinero?
No ahorra dinero. display: "omitted" solo hace que la API no devuelva el texto de pensamiento, reduciendo la latencia de transmisión de red. Pero los tokens de pensamiento internos aún se generan y facturan. El verdadero ahorro viene de reducir el nivel de effort: low o medium hará que Claude omita o reduzca el pensamiento en problemas simples.
P4: ¿Cómo saber si Claude realizó pensamiento en una solicitud específica?
Verifica si la respuesta contiene un bloque de contenido de tipo thinking. Si Claude determina que no es necesario pensar, la respuesta solo tendrá un bloque text, sin bloque thinking. En modo Adaptive, el conteo de tokens en el campo usage puede ayudarte a determinar cuántos tokens consumió el pensamiento.
P5: ¿Cómo usar Adaptive Thinking en Claude Code?
Claude Code habilita Adaptive Thinking por defecto cuando usa Opus 4.6 o Sonnet 4.6. Puedes ajustar la profundidad del pensamiento con el comando /effort: /effort low (modo rápido), /effort medium (modo equilibrado), /effort high (modo profundo). La actualización de marzo de 2026 también corrigió el error "adaptive thinking is not supported" causado por cadenas de modelo no estándar.
Resumen: Adaptive Thinking es la mejora central de Claude 4.6
Adaptive Thinking representa una evolución importante en el modo de razonamiento de la IA: pasa de "el desarrollador adivina cuánto necesita pensar la IA" a "la IA misma juzga cuánto necesita pensar".
4 mejoras centrales:
- Toma de decisiones dinámica: respuestas instantáneas para preguntas simples, razonamiento profundo para problemas complejos
- Pensamiento entrelazado automático: razonamiento automático entre llamadas a herramientas en flujos de trabajo tipo agente
- Diálogo flexible de múltiples turnos: sin necesidad de comenzar con un bloque de pensamiento forzado
- Parámetro
effort: una forma de control más intuitiva quebudget_tokens
Recomendación de migración: Cambiar de thinking: {"type": "enabled", "budget_tokens": N} a thinking: {"type": "adaptive"}, combinado con output_config: {"effort": "..."} para controlar la profundidad.
Se recomienda acceder rápidamente a la API de Claude Opus 4.6 y Sonnet 4.6 a través de APIYI apiyi.com. Con solo un cambio de parámetro podrás disfrutar del razonamiento inteligente y la optimización de costos que ofrece Adaptive Thinking.
Referencias
-
Documentación de la API de Claude – Adaptive Thinking: guía técnica oficial
- Enlace:
platform.claude.com/docs/en/build-with-claude/adaptive-thinking
- Enlace:
-
Documentación de la API de Claude – Parámetro Effort: explicación detallada de la configuración de
effort- Enlace:
platform.claude.com/docs/en/build-with-claude/effort
- Enlace:
-
Anthropic oficial – Claude Opus 4.6: anuncio de lanzamiento
- Enlace:
anthropic.com/news/claude-opus-4-6
- Enlace:
-
Documentación de la API de Claude – Extended Thinking: guía del pensamiento extendido anterior
- Enlace:
platform.claude.com/docs/en/build-with-claude/extended-thinking
- Enlace:
Autor: Equipo de APIYI | Domina las últimas capacidades de la API de Claude. Visita APIYI apiyi.com para obtener la interfaz API y soporte técnico de toda la serie de modelos Claude 4.6.
