Die 5 Hauptunterschiede bei der Abrechnung von OpenAI- und Claude-Caching: Ein detaillierter Vergleich der Rabatte von 90 % vs. 75 %
Der größte Kostenfaktor bei LLM-Anwendungen sind nicht die ausgegebenen Tokens, sondern die wiederholt übertragenen System-Prompts und langen Dokumente. OpenAI und Anthropic haben darauf reagiert – mit Prompt Caching. Doch die Abrechnungsphilosophien beider Unternehmen unterscheiden sich grundlegend: OpenAI setzt auf „Zero-Config und moderate Rabatte“, während Claude den Weg der „expliziten Deklaration und maximalen Rabatte“ geht. Dieser…
