
2026 年 7 月 1 日, Anthropic anunció oficialmente que Claude Fable 5 volvió a estar disponible a nivel global. Este modelo insignia de nivel Mythos, lanzado el 9 de junio y retirado apenas tres días después, regresó a Claude API, Amazon Bedrock y otras plataformas tras casi tres semanas de “desaparición”, ahora con una nueva clasificación de seguridad. Para los desarrolladores, no es solo una noticia: es una oportunidad real de integrarlo.
Eso sí, la versión de regreso de claude-fable-5 tiene varias diferencias claras frente a los modelos Claude habituales: Adaptive Thinking viene activado de forma obligatoria, las solicitudes pueden ser rechazadas por el clasificador de seguridad y devolver stop_reason: "refusal", y hay que añadir lógica de degradación (fallback) al código de integración. Estos cambios afectan directamente a cómo escribes tus llamadas.
En este artículo vamos a analizar el regreso de Claude Fable 5 desde cuatro ángulos: cronología, especificaciones del modelo, integración por API y manejo de respuestas de rechazo, con ejemplos de código que puedes ejecutar tal cual. Si quieres saltarte procesos engorrosos como pedir una cuenta de AWS, puedes usar directamente el canal oficial de reenvío de AWS Claude que ofrece APIYI apiiyi.com para invocar claude-fable-5, con el mismo nombre de modelo que el oficial.
Cronología del regreso de Claude Fable 5: de la retirada a la reactivación
Para entender la importancia de este regreso, primero hay que ver por lo que pasó Claude Fable 5. Según el anuncio oficial de Anthropic y reportes de varios medios, la cronología completa fue la siguiente.
| Fecha | Evento |
|---|---|
| 9 de junio de 2026 | Se lanzan oficialmente Claude Fable 5 y Claude Mythos 5; Fable 5 queda disponible en Claude API, Amazon Bedrock, Google Cloud y Microsoft Foundry |
| 12 de junio de 2026 | Por una directiva de control de exportaciones del Departamento de Comercio de EE. UU., Fable 5 y Mythos 5 se retiran de forma obligatoria |
| Mediados y finales de junio de 2026 | Anthropic se comunica con el gobierno de EE. UU. y desarrolla de forma específica una nueva generación de clasificadores de ciberseguridad |
| 1 de julio de 2026 | Se levantan las restricciones de control de exportaciones y Claude Fable 5 vuelve a estar disponible globalmente con su nuevo clasificador de seguridad |
| 1 al 7 de julio de 2026 | Periodo promocional para suscriptores: los planes Pro/Max/Team y los asientos empresariales avanzados pueden usarlo gratis hasta el 50% del límite semanal |
El detonante directo de la retirada fue que el equipo de investigación de Amazon descubrió una técnica de jailbreak capaz de eludir la protección de seguridad de Fable 5 y engañar al modelo para que identificara vulnerabilidades de software. El gobierno de EE. UU. consideró que eso representaba un riesgo grave de ciberseguridad, y el Departamento de Comercio emitió de inmediato la directiva de control de exportaciones. Fue la primera vez en la industria de la IA que un modelo insignia se retiró por completo por orden gubernamental.
La principal novedad de la versión de regreso es una nueva capa de clasificadores orientados a tareas de ciberseguridad. Anthropic afirma que este nuevo clasificador puede bloquear, en más del 99% de los casos, la técnica de jailbreak mencionada en el informe de Amazon, y que además fue validado por el Centro de Estándares e Innovación en IA de EE. UU. (CAISI). El precio a pagar es que algunas tareas normales de programación y depuración también pueden verse afectadas por error; precisamente por eso existe el mecanismo de gestión de refusal que veremos más adelante.

Especificaciones y precios de claude-fable-5: un escalón por encima de Opus
Claude Fable 5 es el primer miembro de la nueva capa Mythos de Anthropic. Se posiciona por encima de Claude Opus y, a día de hoy, es el modelo público más potente disponible de Anthropic. Comparte la misma base que Claude Mythos 5, que solo pueden usar clientes aprobados bajo Project Glasswing; la diferencia es que Fable 5 incluye un clasificador de seguridad integrado, mientras que Mythos 5 no lo tiene.
Para los desarrolladores, los parámetros más importantes son los de la siguiente tabla.
| Especificación | Parámetro de claude-fable-5 |
|---|---|
| Nombre del modelo API | claude-fable-5 |
| Ventana de contexto | 1M (1 millón) de token por defecto |
| Salida máxima por llamada | 128K token |
| Precio de entrada | $10 / millón de token |
| Precio de salida | $50 / millón de token |
| Modo de pensamiento | Pensamiento adaptativo activado de forma obligatoria, no se puede desactivar |
| Retención de datos | 30 días, sin soporte para cero retención de datos (ZDR) |
| Plataformas disponibles | Claude API, Amazon Bedrock, Google Cloud, Microsoft Foundry |
Hay dos puntos que conviene explicar un poco más. Primero, la ventana de contexto de 1M token es la configuración por defecto, no una función beta que haya que solicitar. Eso significa que se puede enviar de una sola vez un repositorio de código mediano o cientos de páginas de documentación, lo que supone una mejora enorme para análisis de documentos largos y tareas de refactorización de grandes bases de código. Segundo, el pensamiento adaptativo es el único modo de pensamiento de claude-fable-5: thinking: {"type": "disabled"} dará error directamente. La única forma de controlar la profundidad del razonamiento y el coste es mediante el parámetro effort, así que el código migrado desde Opus 4.8 debe revisarse con cuidado.
Además de las especificaciones básicas, también importa mucho el soporte funcional con el que llega claude-fable-5. Desde el primer día de lanzamiento ya soporta prácticamente toda la infraestructura de agentes que Anthropic ha ido presentando durante el último año, y esa es la base de su posicionamiento como "modelo preferido para tareas de agente de largo alcance". El soporte concreto es el siguiente:
| Función | Estado | Valor para el desarrollador |
|---|---|---|
| Parámetro effort | Disponible de forma general | Controla la profundidad del pensamiento y sustituye al interruptor thinking eliminado |
| Herramienta de memoria (memory tool) | Disponible de forma general | Persiste contexto entre sesiones, ideal para agentes de larga duración |
| Ejecución de código (code execution) | Disponible de forma general | El modelo ejecuta código directamente para verificar resultados |
| Llamada programática a herramientas | Disponible de forma general | Orquesta herramientas por código en lotes y reduce tokens de ida y vuelta |
| Presupuestos de tareas (task budgets) | beta | Permite fijar un límite de token para la tarea mediante header |
| Edición de contexto (context editing) | beta | Limpia automáticamente resultados antiguos de herramientas y reduce el coste en sesiones largas |
| Compaction y comprensión visual | Disponible de forma general | Resume automáticamente sesiones largas; admite entrada de imágenes |
Esta lista importa bastante a nivel de arquitectura: si tu sistema de agentes estaba atado a Sonnet solo por usar la herramienta de memoria o la ejecución de código, ahora claude-fable-5 te ofrece una opción más potente con la misma interfaz. En muchos casos, migrar solo requiere cambiar el nombre del modelo y adaptar el manejo de refusals.
Sobre promociones, hay que distinguir bien una cosa: la cuota gratuita del 1 al 7 de julio, equivalente al 50% del límite semanal, solo aplica a usuarios de planes Pro, Max, Team y de puestos Enterprise avanzados en el lado de suscripción de Claude. Documento de referencia: support.claude.com/en/articles/15424964. Las llamadas a la API no entran en esa promoción y siempre se facturan aparte con la tarifa estándar de $10/$50. Así que, para quien desarrolla vía API, el foco no está en aprovechar una ventana promocional, sino en controlar los tokens de salida con effort.
🎯 Recomendación de selección: un precio de salida de $50 por millón hace que claude-fable-5 encaje mejor en escenarios de "pocas llamadas de alto valor", como razonamiento complejo, tareas de agente de largo alcance o revisiones de código a gran escala, y no tanto en tareas ligeras de alta frecuencia. Recomendamos probar primero con poco tráfico en la plataforma APIYI apiyi.com, que permite cambiar entre claude-fable-5, Opus, Sonnet y otros modelos con una interfaz unificada. Así puedes comparar resultados y costes con el mismo código antes de decidir.
Primeros pasos con claude-fable-5 API: integración en 3 pasos
Tras volver a estar disponible, el canal oficial requiere una cuenta de Claude API o permisos de AWS Bedrock (el ID del modelo en Bedrock es anthropic.claude-fable-5). Lo más habitual entre desarrolladores en China es integrarlo mediante una plataforma agregadora. APIYI ofrece precisamente un canal de reenvío oficial de AWS Claude: la petición se reenvía por la ruta oficial de AWS Bedrock, el nombre del modelo sigue siendo claude-fable-5 y es compatible con los formatos de llamada de OpenAI y Anthropic.
Paso 1: obtener la API Key
Después de registrarte en APIYI apiyi.com, crea una API Key desde el panel de control. Los usuarios nuevos tienen crédito de prueba gratuito, así que puedes comprobar primero el rendimiento real de claude-fable-5 antes de recargar saldo.
Paso 2: enviar la primera solicitud
Aquí tienes el ejemplo mínimo con curl; solo tienes que apuntar base_url a la dirección de la API de APIYI:
curl https://api.apiyi.com/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $APIYI_API_KEY" \
-d '{
"model": "claude-fable-5",
"messages": [
{"role": "user", "content": "用一段话解释什么是自适应思考"}
],
"max_tokens": 1024
}'
La versión en Python también es muy sencilla; con el SDK de OpenAI solo hay que modificar base_url:
from openai import OpenAI
client = OpenAI(
api_key="你的APIYI_KEY",
base_url="https://api.apiyi.com/v1"
)
resp = client.chat.completions.create(
model="claude-fable-5",
messages=[{"role": "user", "content": "分析这段代码的时间复杂度"}],
max_tokens=2048
)
print(resp.choices[0].message.content)
Paso 3: usar el parámetro effort para controlar la profundidad del pensamiento
Como el pensamiento adaptativo no se puede desactivar, la forma correcta de controlar el coste es ajustar el parámetro effort. Un effort bajo funciona bien para tareas simples como reformateo o resúmenes; un effort alto conviene dejarlo para razonamiento matemático, diseño de arquitectura y otros casos más exigentes. Otro detalle importante: claude-fable-5 nunca devuelve la cadena de pensamiento en bruto. Si thinking.display se establece en "summarized", devuelve un resumen del razonamiento; si usa el valor predeterminado "omitted", el campo thinking llega vacío. Los flujos de trabajo que dependían de la cadena de pensamiento para depuración tienen que ajustar sus expectativas.
En las conversaciones de varios turnos también hay un detalle fácil de pasar por alto: dentro de la misma sesión, hay que reenviar tal cual el bloque thinking devuelto en el turno anterior; no lo modifiques ni lo elimines, porque eso puede afectar a la coherencia del razonamiento. Si cambias de modelo en mitad de la conversación —por ejemplo, si bajas de claude-fable-5 a Opus 4.8—, entonces hay que seguir las indicaciones oficiales para manejar la compatibilidad del bloque thinking. Este tipo de detalles suele dar problemas cuando la integración es propia; al usar una plataforma agregadora madura, normalmente la compatibilidad ya está resuelta en la capa de gateway.
Las recomendaciones de parámetros según el tipo de tarea son las siguientes:
| Tipo de tarea | Recomendación de effort | Recomendación de max_tokens | Nivel de coste |
|---|---|---|---|
| Resumen, conversión de formato | low | 1K-2K | Bajo |
| Generación de código habitual | medium | 4K-8K | Medio |
| Razonamiento complejo, demostraciones matemáticas | high | 16K+ | Alto |
| Tareas de agente de largo alcance, grandes refactorizaciones | high | 32K-128K | Muy alto |
💡 Consejo práctico: si tu negocio combina tareas ligeras y pesadas, no hace falta que todo pase por claude-fable-5. Con la interfaz unificada de APIYI apiyi.com, puedes enrutar las solicitudes según su dificultad hacia claude-fable-5, Opus 4.8 o Sonnet. Con la misma autenticación y estructura de código, el coste total suele bajar más de la mitad.
Claude Fable 5 gestión de respuestas de rechazo (refusal): el mayor cambio de integración tras la regresión
Esta es la diferencia más grande entre claude-fable-5, tras su regresión, y todos los modelos Claude anteriores, y también el punto de integración que la documentación oficial recalca una y otra vez. Debido a la existencia del nuevo clasificador de seguridad, el modelo puede rechazar ciertas solicitudes, especialmente tareas de ciberseguridad relacionadas con análisis de vulnerabilidades y pruebas de penetración; incluso algunas solicitudes normales de depuración de código pueden ser marcadas por error.
La clave es esta: un rechazo no es un error. Cuando el clasificador bloquea una solicitud, la Messages API devuelve una respuesta exitosa HTTP 200, el campo stop_reason toma el valor "refusal", y la respuesta también indica qué clasificador hizo el bloqueo. Si tu código solo revisa el estado HTTP, terminará tratando una respuesta de rechazo como si fuera una salida normal; ese es el error más fácil de cometer al integrar.

La buena noticia es que las solicitudes rechazadas por Fable 5 normalmente sí pueden resolverse con otros modelos Claude, y la documentación oficial ofrece tres formas de degradación:
| Opción de fallback | Forma de implementación | Escenario de uso |
|---|---|---|
| Fallback del lado del servidor | Pasar el parámetro fallbacks en la solicitud; la API reintenta automáticamente (beta) |
Cuando quieres cero cambios de código y aceptas estado beta |
| Fallback del lado del cliente | Middleware oficial del SDK (Python/TS/Go/Java/C#) con reintento automático | Cuando necesitas un comportamiento consistente en varias plataformas |
| Fallback manual | Capturar tú mismo stop_reason: "refusal" y volver a llamar a otro modelo |
Cuando necesitas control total sobre la lógica de reintento |
Las reglas de cobro también están diseñadas en consecuencia: las solicitudes rechazadas antes de generar cualquier salida no se cobran; cuando un fallback reintenta hacia otro modelo, el mecanismo de fallback credit devuelve el coste de caché de indicación generado por el cambio, evitando pagar dos veces por el mismo contexto.
Además de implementar la degradación, también recomendamos registrar en la puerta de enlace o en la capa de aplicación el stop_reason de cada solicitud, y monitorizar y alertar sobre la proporción de refusals. Por un lado, un aumento repentino en la tasa de refusal suele significar que Anthropic ajustó la estrategia del clasificador, así que conviene evaluar el impacto en el negocio cuanto antes; por otro lado, los datos a largo plazo te ayudan a identificar qué tipos de prompts disparan falsos positivos, y reescribir la indicación —por ejemplo, evitando expresiones sensibles como "escanear vulnerabilidades" o "eludir restricciones"— puede reducir bastante la probabilidad de bloqueo.
La lógica central del fallback manual es de unas diez líneas de código:
resp = call_model("claude-fable-5", messages)
if resp.stop_reason == "refusal":
# Bloqueado por el clasificador de seguridad, reintenta con Opus 4.8
resp = call_model("claude-opus-4-8", messages)
🎯 Recomendación de arquitectura: al integrar claude-fable-5 en producción, asegúrate de incluir el manejo de refusal en la lista de verificación de despliegue. Recomendamos activar en la plataforma APIYI apiyi.com tanto claude-fable-5 como claude-opus-4-8, porque ambos comparten el mismo
base_urly la misma API Key, así que el código de fallback de arriba puede ejecutarse directamente sin configuración adicional de autenticación.
Claude Fable 5 Preguntas frecuentes FAQ
Q1: ¿Qué diferencia hay entre Claude Fable 5 y Claude Mythos 5? ¿Cuál debería usar?
Son el mismo modelo subyacente, con capacidad y precio totalmente iguales. La diferencia es que Fable 5 trae un clasificador de seguridad integrado y está disponible públicamente, mientras que Mythos 5 no tiene clasificador y solo está abierto a clientes aprobados de Project Glasswing. Para la gran mayoría de desarrolladores, claude-fable-5 es la única opción disponible, y además es suficiente.
Q2: ¿La promoción del 1 al 7 de julio aplica a llamadas API?
No. La promoción solo cubre el lado de suscripción de Claude (Pro/Max/Team/puestos empresariales avanzados), con un importe equivalente al 50% del límite semanal. Las llamadas API siempre se facturan con la tarifa estándar de $10/$50 por millón de tokens; claude-fable-5 a través de APIYI apiyi.com se cobra según el uso real, sin mínimo mensual, así que es ideal para validaciones a pequeña escala.
Q3: ¿La versión regresada de claude-fable-5 rechazará con frecuencia solicitudes normales?
Anthropic indica que alrededor del 99% de las tareas habituales no se ven afectadas, pero las solicitudes relacionadas con explotación de vulnerabilidades y auditorías de seguridad tienen una probabilidad mucho mayor de ser bloqueadas; incluso la depuración de código normal puede sufrir falsos positivos de vez en cuando. En producción, es imprescindible implementar lógica de fallback y enrutar automáticamente las solicitudes rechazadas a modelos como Opus 4.8 como respaldo.
Q4: ¿El modelo puede volver a ser retirado por motivos de política?
No se puede descartar por completo, pero en esta ocasión el retorno pasó por la validación de CAISI y la restricción de exportación se levantó oficialmente, así que el riesgo de una nueva retirada a corto plazo es bajo. La forma de prevenirlo a nivel de arquitectura es no codificar un único modelo: conéctate mediante una interfaz unificada en una plataforma agregadora y, si algún modelo deja de estar disponible, basta con cambiar una línea del nombre del modelo para pasar a una alternativa como Opus 4.8 sin interrumpir el negocio.
Q5: ¿Qué diferencia hay entre llamar a claude-fable-5 mediante AWS y hacerlo directo contra la API de Anthropic?
El modelo es exactamente el mismo; los pesos, la capacidad y el comportamiento del clasificador de seguridad también lo son. La diferencia principal está en la experiencia de integración: conectarse directo a Anthropic requiere métodos de pago y entorno de red internacionales, mientras que el acceso directo a Bedrock requiere cuenta de AWS y aprobación de habilitación del modelo (el ID del modelo en Bedrock es anthropic.claude-fable-5). El canal oficial de reenvío AWS de APIYI apiyi.com se encarga de eliminar esos dos pasos; mantiene el nombre de modelo claude-fable-5, factura en RMB y conserva la estabilidad de la ruta oficial de Bedrock, así que es una opción más práctica para equipos en China.
Q6: ¿Qué hay que tener en cuenta al usar realmente 1M de ventana de contexto?
Las ventanas de contexto muy largas elevan bastante el coste de entrada; una sola llamada con 1M de tokens cuesta $10. Conviene combinarlo con caché de indicación: los prefijos largos y repetidos de documentos pueden reducir mucho el coste. Además, ten en cuenta que el periodo de retención de datos de claude-fable-5 es de 30 días y no admite retención cero, así que las aplicaciones sensibles a cumplimiento de datos deben evaluarlo con antelación.
Resumen: la forma correcta de integrar Claude Fable 5 tras su regreso
El regreso de Claude Fable 5 le devuelve a los desarrolladores la entrada a un modelo de nivel Mythos: 1M de contexto, 128K de salida y una capacidad de razonamiento que supera a Opus. El nombre del modelo claude-fable-5 se mantiene sin cambios. Pero esta versión no es una simple “restauración tal cual”: el pensamiento adaptativo está activado de forma obligatoria, el clasificador de seguridad puede devolver stop_reason: "refusal" y hace falta una lógica de fallback con degradación. Estos tres puntos son la nueva realidad que todo código de integración debe soportar.
En cuanto a la ruta de acceso, los usuarios de suscripción pueden aprovechar el periodo promocional antes del 7 de julio para probarlo gratis en el cliente de Claude; para los desarrolladores de API, se recomienda conectarse a través del canal oficial de reenvío AWS Claude de APIYI apiyi.com, con una interfaz unificada que cubre tanto claude-fable-5 como opciones de degradación como Opus y Sonnet. Una vez que pongas en marcha las tres etapas de integración y el manejo de refusal explicadas en este artículo, ya podrás llevar con confianza este modelo de Claude tan potente a entornos de producción.
Autor: APIYI Team, enfocado en el acceso a APIs de Modelos de Lenguaje Grande de IA y en prácticas de ingeniería. Para más evaluaciones de modelos y tutoriales de integración, visita APIYI apiyi.com.
