5 principais diferenças de cobrança de cache entre OpenAI e Claude: comparação profunda de descontos de 90% vs 75%
O maior "buraco negro" de custos ao rodar aplicações de Modelos de Linguagem Grande nunca foi a saÃda de tokens, mas sim o system prompt e os documentos longos que são retransmitidos repetidamente. Tanto a OpenAI quanto a Anthropic apresentaram a solução — o cache de comandos (prompt caching) —, mas a filosofia de cobrança…
