Coinbase đã thành công trong việc giảm chi phí cho AI gần 50% bằng cách triển khai các mô hình trọng số mở và tối ưu hóa cơ sở hạ tầng của mình, theo CEO Brian Armstrong. Công ty đã chuyển sang sử dụng các mô hình như GLM 5.2 của Zhipu và Kimi 2.7 của Moonshot AI làm tùy chọn mặc định, cho phép các kỹ sư lựa chọn mô hình phù hợp nhất cho các nhiệm vụ cụ thể. Bước đi chiến lược này đã giúp 91% nhân viên tránh được việc vượt quá giới hạn sử dụng, từ đó giảm chi phí mà không hạn chế việc sử dụng AI. Coinbase cũng đã cải thiện các chiến lược định tuyến và lưu trữ đệm. Bằng cách tiền xử lý các yêu cầu và định tuyến các nhiệm vụ đến các mô hình phù hợp nhất dựa trên tỷ lệ trúng bộ nhớ đệm và giá cả, công ty đã tăng tỷ lệ trúng bộ nhớ đệm từ 5% lên 60%. Armstrong nhấn mạnh rằng mục tiêu là tạo ra một cơ sở hạ tầng bền vững hỗ trợ tăng trưởng theo cấp số nhân, tập trung vào việc giảm lãng phí token và nâng cao khả năng hiển thị sử dụng để đảm bảo các kết quả đầu ra có tác động cao từ các khoản đầu tư vào AI.