Qwen 3.6 27B Modell erreicht 40 Tokens/s auf RTX 3090

Das Qwen 3.6 27B Dense-Modell hat laut vorläufigen Tests des Nutzers @sudoingX eine Verarbeitungsgeschwindigkeit von 40 Tokens pro Sekunde auf einer RTX 3090 24GB GPU gezeigt. Die Tests wurden ohne Quantisierungstechniken oder verschmolzene Kernel durchgeführt, wobei eine direkte Q4_K_M-Quantisierung über llama.cpp verwendet wurde, und bestanden alle 10 von 10 Tests erfolgreich. Zusätzlich wurde ein Particle-Swarm-Benchmark entwickelt, um die Leistung des Modells zu bewerten.

Quelle: Original anzeigen

Haftungsausschluss: Die auf Phemex News bereitgestellten Inhalte dienen nur zu Informationszwecken.Wir garantieren nicht die Qualität, Genauigkeit oder Vollständigkeit der Informationen aus Drittquellen.Die Inhalte auf dieser Seite stellen keine Finanz- oder Anlageberatung dar.Wir empfehlen dringend, eigene Recherchen durchzuführen und einen qualifizierten Finanzberater zu konsultieren, bevor Sie Anlageentscheidungen treffen.