L'équipe PAI d'Alibaba a publié le modèle AgenticQwen, un modèle de langage agent léger conçu pour l'invocation d'outils de niveau industriel, désormais open source en versions 8B et 30B-A3B. Utilisant un cadre novateur d'apprentissage par renforcement appelé "double volant de données", le modèle atteint des capacités similaires à celles des grands modèles tout en réduisant les coûts d'inférence. L'approche du double volant améliore les performances en générant des scénarios complexes de prise de décision et en s'améliorant à partir des erreurs du modèle.
AgenticQwen-8B obtient une moyenne de 47,4 sur des benchmarks tels que TAU-2 et BFCL-V4, surpassant le modèle de base Qwen3-8B et se rapprochant du modèle Qwen3-235B. La version 30B-A3B, qui active seulement 3 milliards de paramètres, atteint un score de 50,2. Malgré son succès, la limitation de la longueur de contexte à 40 000 tokens du modèle pose des défis dans les tâches de recherche approfondie. Le modèle est déjà utilisé au sein des systèmes internes d'Alibaba, offrant de meilleures performances avec des temps d'inférence plus courts.
L'équipe PAI d'Alibaba publie en open source le modèle AgenticQwen avec double volant de données
Avertissement : Le contenu proposé sur Phemex News est à titre informatif uniquement. Nous ne garantissons pas la qualité, l'exactitude ou l'exhaustivité des informations provenant d'articles tiers. Ce contenu ne constitue pas un conseil financier ou d'investissement. Nous vous recommandons vivement d'effectuer vos propres recherches et de consulter un conseiller financier qualifié avant toute décision d'investissement.
