Команда PAI компании Alibaba выпустила модель AgenticQwen — легковесную языковую модель агента, разработанную для промышленного вызова инструментов, теперь с открытым исходным кодом в версиях 8B и 30B-A3B. Используя новую структуру обучения с подкреплением «двойное маховик данных», модель достигает возможностей, сопоставимых с крупными моделями, при сниженных затратах на вывод. Подход с двойным маховиком повышает производительность за счёт генерации сложных сценариев принятия решений и улучшения на основе ошибок модели. AgenticQwen-8B набирает в среднем 47,4 балла по таким бенчмаркам, как TAU-2 и BFCL-V4, превосходя базовую модель Qwen3-8B и приближаясь к модели Qwen3-235B. Версия 30B-A3B, активирующая только 3 миллиарда параметров, набирает 50,2 балла. Несмотря на успех, ограничение длины контекста в 40 тысяч токенов создаёт трудности при выполнении глубоких поисковых задач. Модель уже используется во внутренних системах Alibaba, обеспечивая улучшенную производительность при более коротком времени вывода.