El equipo PAI de Alibaba ha lanzado el modelo AgenticQwen, un modelo de lenguaje agente ligero diseñado para la invocación de herramientas de grado industrial, ahora de código abierto en versiones 8B y 30B-A3B. Utilizando un novedoso marco de aprendizaje por refuerzo "doble volante de datos", el modelo alcanza capacidades similares a las de modelos grandes con costos de inferencia reducidos. El enfoque de doble volante mejora el rendimiento generando escenarios complejos de toma de decisiones y aprendiendo de los errores del modelo.
AgenticQwen-8B obtiene un promedio de 47.4 en benchmarks como TAU-2 y BFCL-V4, superando al Qwen3-8B base y acercándose al modelo Qwen3-235B. La versión 30B-A3B, que activa solo 3 mil millones de parámetros, obtiene una puntuación de 50.2. A pesar de su éxito, la limitación de longitud de contexto de 40K del modelo presenta desafíos en tareas de búsqueda profunda. El modelo ya está en uso dentro de los sistemas internos de Alibaba, ofreciendo un rendimiento mejorado con tiempos de inferencia más cortos.
El equipo PAI de Alibaba publica en código abierto el modelo AgenticQwen con doble volante de datos
Aviso legal: El contenido de Phemex News es únicamente informativo.No garantizamos la calidad, precisión ni integridad de la información procedente de artículos de terceros.El contenido de esta página no constituye asesoramiento financiero ni de inversión.Le recomendamos encarecidamente que realice su propia investigación y consulte con un asesor financiero cualificado antes de tomar cualquier decisión de inversión.
