Команда PAI компании Alibaba выпустила модель AgenticQwen — легковесную языковую модель агента, разработанную для промышленного вызова инструментов, теперь с открытым исходным кодом в версиях 8B и 30B-A3B. Используя новую структуру обучения с подкреплением «двойное маховик данных», модель достигает возможностей, сопоставимых с крупными моделями, при сниженных затратах на вывод. Подход с двойным маховиком повышает производительность за счёт генерации сложных сценариев принятия решений и улучшения на основе ошибок модели.
AgenticQwen-8B набирает в среднем 47,4 балла по таким бенчмаркам, как TAU-2 и BFCL-V4, превосходя базовую модель Qwen3-8B и приближаясь к модели Qwen3-235B. Версия 30B-A3B, активирующая только 3 миллиарда параметров, набирает 50,2 балла. Несмотря на успех, ограничение длины контекста в 40 тысяч токенов создаёт трудности при выполнении глубоких поисковых задач. Модель уже используется во внутренних системах Alibaba, обеспечивая улучшенную производительность при более коротком времени вывода.
Команда PAI Alibaba открывает исходный код модели AgenticQwen с двойным циклом данных
Отказ от ответственности: Контент, представленный на сайте Phemex News, предназначен исключительно для информационных целей.Мы не гарантируем качество, точность и полноту информации, полученной из статей третьих лиц.Содержание этой страницы не является финансовым или инвестиционным советом.Мы настоятельно рекомендуем вам провести собственное исследование и проконсультироваться с квалифицированным финансовым консультантом, прежде чем принимать какие-либо инвестиционные решения.
