Un ingénieur d'Anthropic a partagé des informations sur la manière d'optimiser l'utilisation des tokens dans Claude Code en exploitant les mécanismes de mise en cache, ce qui pourrait permettre aux utilisateurs d'économiser jusqu'à 300 millions de tokens par semaine. La clé pour réduire les coûts réside dans la réutilisation du contexte déjà traité, les tokens mis en cache ne coûtant que 10 % des tokens d'entrée réguliers. En maintenant des préfixes de session cohérents, les utilisateurs peuvent utiliser efficacement les couches de cache, y compris les invites système, les définitions d'outils et l'historique des conversations, afin de minimiser les calculs redondants.
Pour maximiser l'efficacité du cache, il est conseillé aux utilisateurs d'éviter de laisser les sessions inactives pendant plus d'une heure, d'effectuer des transferts de session appropriés lors du changement de tâches, et de placer les documents volumineux dans des Projets plutôt que de les coller dans les conversations. Ces pratiques aident à maintenir un taux de réussite élevé du cache, ce qui prolonge non seulement la durabilité des sessions mais réduit également les coûts de service pour Anthropic. L'ingénieur souligne l'importance de considérer le contexte comme une gestion d'actifs pour permettre une réutilisation continue du cache et améliorer la longévité des sessions de codage.
Un ingénieur d'Anthropic révèle des astuces de mise en cache du code Claude pour économiser des jetons
Avertissement : Le contenu proposé sur Phemex News est à titre informatif uniquement. Nous ne garantissons pas la qualité, l'exactitude ou l'exhaustivité des informations provenant d'articles tiers. Ce contenu ne constitue pas un conseil financier ou d'investissement. Nous vous recommandons vivement d'effectuer vos propres recherches et de consulter un conseiller financier qualifié avant toute décision d'investissement.
