Qwen 3.6 27B Dense 모델은 사용자 @sudoingX의 예비 테스트에 따르면 RTX 3090 24GB GPU에서 초당 40토큰의 처리 속도를 보여주었습니다. 양자화 기법이나 융합 커널 없이 진행된 이 테스트는 llama.cpp를 통한 직접 Q4_K_M 양자화를 사용했으며, 10개 테스트 중 10개를 모두 성공적으로 통과했습니다. 또한, 모델의 성능을 평가하기 위해 입자 군집 벤치마크가 개발되었습니다.