O CEO da Coinbase, Brian Armstrong, anunciou que a empresa conseguiu reduzir seus gastos com IA em quase metade por meio de otimizações estratégicas na infraestrutura. Essas otimizações incluem melhorias nas configurações padrão, roteamento e mecanismos de cache, que foram implementadas em meio a um aumento no uso de tokens. As principais medidas incluem a adoção de modelos de código aberto e econômicos, como GLM 5.2 e Kimi 2.7, que se mostraram suficientes para 91% dos funcionários que nunca atingiram os limites de uso. Além disso, o roteamento inteligente agora direciona automaticamente as tarefas para os modelos mais apropriados, otimizando custos e eficiência. A empresa também aprimorou sua estratégia de cache, aumentando significativamente a taxa de acerto do cache, exemplificada pela melhoria do LibreChat de 5% para 60%. Esses esforços fazem parte de uma iniciativa mais ampla para simplificar as operações e aumentar a transparência nos gastos com IA.