O modelo Qwen 3.6 27B Dense demonstrou uma velocidade de processamento de 40 tokens por segundo em uma GPU RTX 3090 de 24GB, segundo testes preliminares do usuário @sudoingX. Os testes, realizados sem técnicas de quantização ou kernels fundidos, utilizaram quantização direta Q4_K_M via llama.cpp e passaram com sucesso em todos os 10 testes realizados. Além disso, um benchmark de enxame de partículas foi desenvolvido para avaliar o desempenho do modelo.