Инженер компании Anthropic поделился инсайтами о том, как оптимизировать использование токенов в Claude Code с помощью механизмов кэширования, что потенциально позволяет пользователям экономить до 300 миллионов токенов еженедельно. Ключ к снижению затрат заключается в повторном использовании ранее обработанного контекста, при этом кэшированные токены стоят всего 10% от стоимости обычных входных токенов. Поддерживая постоянные префиксы сессий, пользователи могут эффективно использовать уровни кэша, включая системные подсказки, определения инструментов и историю разговоров, чтобы минимизировать избыточные вычисления. Для максимальной эффективности кэша рекомендуется не оставлять сессии бездействующими более часа, правильно передавать сессии при переключении задач и размещать большие документы в Проектах, а не вставлять их в разговоры. Эти практики помогают поддерживать высокий уровень попадания в кэш, что не только увеличивает долговечность сессий, но и снижает затраты на обслуживание для Anthropic. Инженер подчеркивает важность обращения с контекстом как с управлением активами для обеспечения непрерывного повторного использования кэша и увеличения продолжительности кодировочных сессий.