Một người đam mê AI người Trung Quốc, APFrisco, đã thành công trong việc chạy Kimi K2.5 của Moonshot AI, một mô hình có nghìn tỷ tham số, trên một GPU Nvidia RTX 3060 đơn lẻ kết hợp với 768 GB bộ nhớ Intel Optane Persistent Memory. Mặc dù GPU thuộc phân khúc trung bình, thiết lập này đạt khoảng bốn token mỗi giây, cho thấy tiềm năng của các cấu hình phần cứng không truyền thống. Kimi K2.5, một mô hình Mixture-of-Experts, chỉ kích hoạt 32 tỷ tham số cho mỗi token, cho phép nó chạy trên phần cứng tiêu dùng. Kích thước đầy đủ của mô hình khoảng 630 GB, với các phiên bản lượng tử hóa là 381 GB, đòi hỏi phải sử dụng bộ nhớ Optane do tính hiệu quả về chi phí so với DRAM truyền thống. Minh chứng này làm nổi bật khả năng tiếp cận các mô hình AI tiên tiến, vì Kimi K2.5 có trọng số mở, cho phép những người đam mê thử nghiệm AI quy mô lớn mà không cần cơ sở hạ tầng doanh nghiệp.