Xiaomi đã công bố giảm đáng kể chi phí cho các API của dòng MiMo-V2.5, đạt được thông qua các chiến lược thuật toán sáng tạo. Luo Fuli, trưởng nhóm mô hình lớn của Xiaomi, đã trình bày chi tiết những tiến bộ này, nhấn mạnh kiến trúc chú ý lai và tối ưu hóa bộ nhớ đệm KV phân cấp. Những kỹ thuật này đã dẫn đến giảm 99% chi phí truy cập bộ nhớ đệm và giảm 80% chi phí bộ nhớ đệm, nhờ tăng dung lượng bộ nhớ đệm token và việc đọc bộ nhớ đệm chồng chéo.
Hiệu quả của mô hình MiMo-V2.5-Pro còn được nâng cao bởi tỷ lệ thưa thớt giữa các lớp là 1:7, cho phép nó thực hiện các phép tính chú ý tương đương với mô hình truyền thống 10 lớp, mặc dù có tới 70 lớp. Tối ưu hóa này đã giảm một nửa chi phí suy luận của Xiaomi, cho phép giảm giá mà không ảnh hưởng đến lợi nhuận. Luo nhấn mạnh tầm quan trọng của quản lý chi phí chiến lược thay vì chiến tranh giá cả, ủng hộ dịch vụ suy luận bền vững, chi phí thấp để thúc đẩy nhu cầu cho các ứng dụng thông minh.
Mẫu MiMo-V2.5 của Xiaomi Giảm Chi Phí với Tính Toán Chú Ý Tiên Tiến
Tuyên bố miễn trừ trách nhiệm: Nội dung được cung cấp trên Phemex News chỉ nhằm mục đích cung cấp thông tin.Chúng tôi không đảm bảo chất lượng, độ chính xác hoặc tính đầy đủ của thông tin có nguồn từ các bài viết của bên thứ ba.Nội dung trên trang này không cấu thành lời khuyên về tài chính hoặc đầu tư.Chúng tôi đặc biệt khuyến khích bạn tự tiến hành nghiên cứu và tham khảo ý kiến của cố vấn tài chính đủ tiêu chuẩn trước khi đưa ra bất kỳ quyết định đầu tư nào.
