Anthropicのエンジニアが、キャッシュ機構を活用してClaude Codeのトークン使用を最適化する方法についての洞察を共有しました。これにより、ユーザーは週に最大3億トークンを節約できる可能性があります。コスト削減の鍵は、以前に処理されたコンテキストを再利用することであり、キャッシュされたトークンは通常の入力トークンのわずか10%のコストで済みます。セッションのプレフィックスを一貫して維持することで、システムプロンプト、ツール定義、会話履歴などのキャッシュレイヤーを効果的に活用し、冗長な計算を最小限に抑えることができます。 キャッシュ効率を最大化するために、ユーザーはセッションを1時間以上放置しないこと、タスクを切り替える際に適切なセッション引き継ぎを行うこと、大きなドキュメントは会話に貼り付けるのではなくプロジェクトに配置することが推奨されています。これらの実践により、高いキャッシュヒット率が維持され、セッションの耐久性が向上するだけでなく、Anthropicのサービスコストも削減されます。エンジニアは、コンテキストを資産管理として扱い、継続的なキャッシュ再利用を可能にし、コーディングセッションの寿命を延ばすことの重要性を強調しています。