3 entscheidende Punkte zur Beherrschung der Claude-Cache-Abrechnung: Warum der Modellaufruf im nativen Anthropic-Format erfolgen muss
Viele Entwickler stoßen bei der Nutzung der Claude API auf ein Rätsel: Obwohl Prompt-Caching aktiviert ist, warum erscheinen keine Rabatte auf der Abrechnung? Die Antwort ist oft simpel: Sie verwenden den OpenAI-kompatiblen Modus für den Modellaufruf, aber das Caching-System von Claude unterstützt ausschließlich das native Anthropic Messages API-Format. Das ist kein Bug, sondern eine in…
