Mô hình Qwen 3.6 27B đạt tốc độ 40 token/giây trên RTX 3090

Mô hình Qwen 3.6 27B Dense đã chứng minh tốc độ xử lý 40 token mỗi giây trên GPU RTX 3090 24GB, theo các bài kiểm tra sơ bộ của người dùng @sudoingX. Các bài kiểm tra, được thực hiện mà không sử dụng kỹ thuật lượng tử hóa hay nhân hợp nhất, đã sử dụng lượng tử hóa trực tiếp Q4_K_M qua llama.cpp và đã vượt qua thành công tất cả 10 trên 10 bài kiểm tra. Ngoài ra, một chuẩn đánh giá bầy đàn hạt đã được phát triển để đánh giá hiệu suất của mô hình.

Nguồn: Hiển thị bản gốc

Tuyên bố miễn trừ trách nhiệm: Nội dung được cung cấp trên Phemex News chỉ nhằm mục đích cung cấp thông tin.Chúng tôi không đảm bảo chất lượng, độ chính xác hoặc tính đầy đủ của thông tin có nguồn từ các bài viết của bên thứ ba.Nội dung trên trang này không cấu thành lời khuyên về tài chính hoặc đầu tư.Chúng tôi đặc biệt khuyến khích bạn tự tiến hành nghiên cứu và tham khảo ý kiến của cố vấn tài chính đủ tiêu chuẩn trước khi đưa ra bất kỳ quyết định đầu tư nào.