Um engenheiro da Anthropic compartilhou insights sobre como otimizar o uso de tokens no Claude Code aproveitando mecanismos de cache, potencialmente economizando até 300 milhões de tokens por semana para os usuários. A chave para reduzir custos está em reutilizar o contexto previamente processado, com tokens em cache custando apenas 10% dos tokens de entrada regulares. Mantendo prefixos de sessão consistentes, os usuários podem utilizar efetivamente as camadas de cache, incluindo prompts do sistema, definições de ferramentas e histórico de conversas, para minimizar cálculos redundantes. Para maximizar a eficiência do cache, os usuários são aconselhados a evitar deixar sessões ociosas por mais de uma hora, realizar transferências adequadas de sessão ao trocar de tarefas e colocar documentos grandes em Projetos, em vez de colá-los nas conversas. Essas práticas ajudam a manter uma alta taxa de acerto no cache, o que não só prolonga a durabilidade da sessão, mas também reduz os custos do serviço para a Anthropic. O engenheiro enfatiza tratar o contexto como gestão de ativos para permitir o reuso contínuo do cache e aumentar a longevidade das sessões de codificação.