Brian Armstrong, CEO von Coinbase, gab bekannt, dass das Unternehmen seine Ausgaben für KI durch strategische Infrastrukturoptimierungen erfolgreich um fast die Hälfte reduziert hat. Zu diesen Optimierungen gehören verbesserte Standardeinstellungen, Routing- und Caching-Mechanismen, die angesichts eines Anstiegs der Token-Nutzung implementiert wurden. Wichtige Maßnahmen umfassen die Einführung von Open-Source- und kostengünstigen Modellen wie GLM 5.2 und Kimi 2.7, die sich für 91 % der Mitarbeiter als ausreichend erwiesen haben, die nie Nutzungslimits erreicht haben. Darüber hinaus leitet das intelligente Routing Aufgaben nun automatisch an die jeweils am besten geeigneten Modelle weiter, um Kosten und Effizienz zu optimieren. Das Unternehmen hat auch seine Caching-Strategie verbessert und die Cache-Trefferquote deutlich erhöht, was sich am Beispiel von LibreChat zeigt, das von 5 % auf 60 % verbessert wurde. Diese Bemühungen sind Teil einer umfassenderen Initiative zur Straffung der Abläufe und zur Erhöhung der Transparenz bei den KI-Ausgaben.