A Alibaba apresentou sua mais recente arquitetura de modelo de IA, Qwen3-Next, por meio de sua divisão Tongyi Qianwen. O novo modelo, Qwen3-Next-80B-A3B, é de código aberto e apresenta melhorias significativas em relação à arquitetura anterior Qwen3 MoE. As principais melhorias incluem um mecanismo de atenção híbrido, uma estrutura MoE altamente esparsa e um mecanismo de previsão de múltiplos tokens, todos contribuindo para uma inferência mais eficiente. O modelo Qwen3-Next-80B-A3B-Base, construído sobre essa arquitetura, possui 80 bilhões de parâmetros, mas ativa apenas 3 bilhões, alcançando desempenho equivalente ou superior ao modelo denso Qwen3-32B. Notavelmente, seus custos de treinamento são inferiores a um décimo dos do Qwen3-32B, e sua taxa de transferência de inferência para contextos acima de 32k é mais de dez vezes maior, oferecendo uma relação custo-benefício substancial tanto no treinamento quanto na inferência.