Tongyi Qianwen от Alibaba представила свою последнюю флагманскую модель Qwen3.7-Max, которая достигла впечатляющего 10-кратного улучшения производительности оператора Triton на процессоре Pingtouge Zhenwu M890. Это было достигнуто в ходе 35-часовой автономной оптимизации ядра, включающей 1158 вызовов инструментов, без какой-либо документации по архитектуре чипа. Модель прошла пять этапов эволюции, оптимизируя стратегии использования памяти и обработки для полного раскрытия возможностей процессора. Qwen3.7-Max превзошла конкурентов, достигнув 10-кратного геометрического среднего ускорения, превзойдя улучшения GLM 5.1 в 7,3 раза и Kimi K2.6 в 5,0 раза. Обучение модели включало разделение задач и использование обучения с подкреплением через разные фреймворки, что повысило её способности к обобщению. На таких бенчмарках, как MCP-Mark и SpreadSheetBench, Qwen3.7-Max продемонстрировала производительность, близкую к Claude-4.6-Opus-Max.