Un ingénieur d'Anthropic a partagé des informations sur la manière d'optimiser l'utilisation des tokens dans Claude Code en exploitant les mécanismes de mise en cache, ce qui pourrait permettre aux utilisateurs d'économiser jusqu'à 300 millions de tokens par semaine. La clé pour réduire les coûts réside dans la réutilisation du contexte déjà traité, les tokens mis en cache ne coûtant que 10 % des tokens d'entrée réguliers. En maintenant des préfixes de session cohérents, les utilisateurs peuvent utiliser efficacement les couches de cache, y compris les invites système, les définitions d'outils et l'historique des conversations, afin de minimiser les calculs redondants. Pour maximiser l'efficacité du cache, il est conseillé aux utilisateurs d'éviter de laisser les sessions inactives pendant plus d'une heure, d'effectuer des transferts de session appropriés lors du changement de tâches, et de placer les documents volumineux dans des Projets plutôt que de les coller dans les conversations. Ces pratiques aident à maintenir un taux de réussite élevé du cache, ce qui prolonge non seulement la durabilité des sessions mais réduit également les coûts de service pour Anthropic. L'ingénieur souligne l'importance de considérer le contexte comme une gestion d'actifs pour permettre une réutilisation continue du cache et améliorer la longévité des sessions de codage.