Mise en cache des invites Claude non atteinte ? 5 causes à vérifier et seuil minimal de jetons
Lors de l'utilisation de l'API Claude pour des appels avec un long contexte, de nombreux développeurs rencontrent la même confusion : bien que la mise en cache ait été déclarée dans le champ cache_control, les valeurs cache_creation_input_tokens et cache_read_input_tokens dans la réponse restent à 0, et aucune remise sur le cache n'apparaît sur la facture….
