Ein Ingenieur von Anthropic hat Einblicke geteilt, wie man die Token-Nutzung in Claude Code durch den Einsatz von Caching-Mechanismen optimieren kann, was den Nutzern potenziell bis zu 300 Millionen Tokens pro Woche spart. Der Schlüssel zur Kostensenkung liegt in der Wiederverwendung zuvor verarbeiteter Kontexte, wobei zwischengespeicherte Tokens nur 10 % der Kosten regulärer Eingabetokens verursachen. Durch die Beibehaltung konsistenter Sitzungspräfixe können Nutzer Cache-Ebenen effektiv nutzen, einschließlich System-Prompts, Tool-Definitionen und Gesprächshistorie, um redundante Berechnungen zu minimieren. Um die Cache-Effizienz zu maximieren, wird den Nutzern geraten, Sitzungen nicht länger als eine Stunde untätig zu lassen, bei Aufgabenwechseln ordnungsgemäße Sitzungsübergaben durchzuführen und große Dokumente in Projekte einzufügen, anstatt sie in Gespräche einzufügen. Diese Praktiken helfen, eine hohe Cache-Trefferquote aufrechtzuerhalten, was nicht nur die Sitzungsdauer verlängert, sondern auch die Servicekosten für Anthropic senkt. Der Ingenieur betont, den Kontext als Vermögensverwaltung zu behandeln, um eine kontinuierliche Cache-Wiederverwendung zu ermöglichen und die Langlebigkeit von Codierungssitzungen zu verbessern.