Alibaba Open-Source AgenticQwen avec Double Flywheel de Données

L'équipe PAI d'Alibaba a publié le modèle AgenticQwen, un modèle de langage agent léger conçu pour l'invocation d'outils de niveau industriel, désormais open source en versions 8B et 30B-A3B. Utilisant un cadre novateur d'apprentissage par renforcement appelé "double volant de données", le modèle atteint des capacités similaires à celles des grands modèles tout en réduisant les coûts d'inférence. L'approche du double volant améliore les performances en générant des scénarios complexes de prise de décision et en s'améliorant à partir des erreurs du modèle. AgenticQwen-8B obtient une moyenne de 47,4 sur des benchmarks tels que TAU-2 et BFCL-V4, surpassant le modèle de base Qwen3-8B et se rapprochant du modèle Qwen3-235B. La version 30B-A3B, qui active seulement 3 milliards de paramètres, atteint un score de 50,2. Malgré son succès, la limitation de la longueur de contexte à 40 000 tokens du modèle pose des défis dans les tâches de recherche approfondie. Le modèle est déjà utilisé au sein des systèmes internes d'Alibaba, offrant de meilleures performances avec des temps d'inférence plus courts.

Vous pourriez aussi aimer