Das Qwen 3.6 27B Dense-Modell hat laut vorläufigen Tests des Nutzers @sudoingX eine Verarbeitungsgeschwindigkeit von 40 Tokens pro Sekunde auf einer RTX 3090 24GB GPU gezeigt. Die Tests wurden ohne Quantisierungstechniken oder verschmolzene Kernel durchgeführt, wobei eine direkte Q4_K_M-Quantisierung über llama.cpp verwendet wurde, und bestanden alle 10 von 10 Tests erfolgreich. Zusätzlich wurde ein Particle-Swarm-Benchmark entwickelt, um die Leistung des Modells zu bewerten.