Mô hình Qwen 3.6 27B Dense đã chứng minh tốc độ xử lý 40 token mỗi giây trên GPU RTX 3090 24GB, theo các bài kiểm tra sơ bộ của người dùng @sudoingX. Các bài kiểm tra, được thực hiện mà không sử dụng kỹ thuật lượng tử hóa hay nhân hợp nhất, đã sử dụng lượng tử hóa trực tiếp Q4_K_M qua llama.cpp và đã vượt qua thành công tất cả 10 trên 10 bài kiểm tra. Ngoài ra, một chuẩn đánh giá bầy đàn hạt đã được phát triển để đánh giá hiệu suất của mô hình.