Модель Qwen 3.6 27B Dense продемонстрировала скорость обработки 40 токенов в секунду на графическом процессоре RTX 3090 с 24 ГБ памяти, согласно предварительным тестам пользователя @sudoingX. Тесты, проведённые без использования техник квантизации или объединённых ядер, использовали прямую квантизацию Q4_K_M через llama.cpp и успешно прошли все 10 из 10 тестов. Кроме того, был разработан бенчмарк на основе роя частиц для оценки производительности модели.