Alibaba ha presentado su última arquitectura de modelo de IA, Qwen3-Next, a través de su división Tongyi Qianwen. El nuevo modelo, Qwen3-Next-80B-A3B, es de código abierto y presenta mejoras significativas respecto a la anterior arquitectura Qwen3 MoE. Las mejoras clave incluyen un mecanismo de atención híbrido, una estructura MoE altamente dispersa y un mecanismo de predicción de múltiples tokens, que contribuyen a una inferencia más eficiente. El modelo Qwen3-Next-80B-A3B-Base, construido sobre esta arquitectura, cuenta con 80 mil millones de parámetros pero activa solo 3 mil millones, logrando un rendimiento igual o superior al modelo denso Qwen3-32B. Cabe destacar que sus costos de entrenamiento son menos de una décima parte que los del Qwen3-32B, y su rendimiento de inferencia para contextos superiores a 32k es más de diez veces mayor, ofreciendo una gran rentabilidad tanto en entrenamiento como en inferencia.