Le modèle Qwen 3.6 27B Dense a démontré une vitesse de traitement de 40 tokens par seconde sur un GPU RTX 3090 24GB, selon des tests préliminaires réalisés par l'utilisateur @sudoingX. Les tests, effectués sans techniques de quantification ni noyaux fusionnés, ont utilisé une quantification directe Q4_K_M via llama.cpp et ont réussi avec succès les 10 tests sur 10. De plus, un benchmark de type essaim de particules a été développé pour évaluer les performances du modèle.