Um engenheiro da Anthropic compartilhou insights sobre como otimizar o uso de tokens no Claude Code aproveitando mecanismos de cache, potencialmente economizando até 300 milhões de tokens por semana para os usuários. A chave para reduzir custos está em reutilizar o contexto previamente processado, com tokens em cache custando apenas 10% dos tokens de entrada regulares. Mantendo prefixos de sessão consistentes, os usuários podem utilizar efetivamente as camadas de cache, incluindo prompts do sistema, definições de ferramentas e histórico de conversas, para minimizar cálculos redundantes.
Para maximizar a eficiência do cache, os usuários são aconselhados a evitar deixar sessões ociosas por mais de uma hora, realizar transferências adequadas de sessão ao trocar de tarefas e colocar documentos grandes em Projetos, em vez de colá-los nas conversas. Essas práticas ajudam a manter uma alta taxa de acerto no cache, o que não só prolonga a durabilidade da sessão, mas também reduz os custos do serviço para a Anthropic. O engenheiro enfatiza tratar o contexto como gestão de ativos para permitir o reuso contínuo do cache e aumentar a longevidade das sessões de codificação.
Engenheiro da Anthropic Revela Dicas de Cache de Código do Claude para Economizar Tokens
Aviso Legal: O conteúdo disponibilizado no Phemex News é apenas para fins informativos. Não garantimos a qualidade, precisão ou integridade das informações provenientes de artigos de terceiros. Este conteúdo não constitui aconselhamento financeiro ou de investimento. Recomendamos fortemente que você realize suas próprias pesquisas e consulte um consultor financeiro qualificado antes de tomar decisões de investimento.
