Модель Qwen 3.6 27B Dense продемонстрировала скорость обработки 40 токенов в секунду на графическом процессоре RTX 3090 с 24 ГБ памяти, согласно предварительным тестам пользователя @sudoingX. Тесты, проведённые без использования техник квантизации или объединённых ядер, использовали прямую квантизацию Q4_K_M через llama.cpp и успешно прошли все 10 из 10 тестов. Кроме того, был разработан бенчмарк на основе роя частиц для оценки производительности модели.
Модель Qwen 3.6 27B достигает 40 токенов/с на RTX 3090
Отказ от ответственности: Контент, представленный на сайте Phemex News, предназначен исключительно для информационных целей.Мы не гарантируем качество, точность и полноту информации, полученной из статей третьих лиц.Содержание этой страницы не является финансовым или инвестиционным советом.Мы настоятельно рекомендуем вам провести собственное исследование и проконсультироваться с квалифицированным финансовым консультантом, прежде чем принимать какие-либо инвестиционные решения.
