Alibaba ha presentado su última arquitectura de modelo de IA, Qwen3-Next, a través de su división Tongyi Qianwen. El nuevo modelo, Qwen3-Next-80B-A3B, es de código abierto y presenta mejoras significativas respecto a la anterior arquitectura Qwen3 MoE. Las mejoras clave incluyen un mecanismo de atención híbrido, una estructura MoE altamente dispersa y un mecanismo de predicción de múltiples tokens, que contribuyen a una inferencia más eficiente.
El modelo Qwen3-Next-80B-A3B-Base, construido sobre esta arquitectura, cuenta con 80 mil millones de parámetros pero activa solo 3 mil millones, logrando un rendimiento igual o superior al modelo denso Qwen3-32B. Cabe destacar que sus costos de entrenamiento son menos de una décima parte que los del Qwen3-32B, y su rendimiento de inferencia para contextos superiores a 32k es más de diez veces mayor, ofreciendo una gran rentabilidad tanto en entrenamiento como en inferencia.
Alibaba presenta el avanzado modelo de IA Qwen3-Next con mayor eficiencia
Aviso legal: El contenido de Phemex News es únicamente informativo.No garantizamos la calidad, precisión ni integridad de la información procedente de artículos de terceros.El contenido de esta página no constituye asesoramiento financiero ni de inversión.Le recomendamos encarecidamente que realice su propia investigación y consulte con un asesor financiero cualificado antes de tomar cualquier decisión de inversión.