Alibaba, Tongyi Qianwen bölümü aracılığıyla en son yapay zeka model mimarisi Qwen3-Next'i tanıttı. Yeni model Qwen3-Next-80B-A3B açık kaynaklıdır ve önceki Qwen3 MoE mimarisine kıyasla önemli iyileştirmeler sunmaktadır. Temel geliştirmeler arasında hibrit dikkat mekanizması, yüksek seyrekliğe sahip MoE yapısı ve çoklu token tahmin mekanizması yer almakta olup, bunların tümü daha verimli çıkarım yapılmasına katkı sağlamaktadır. Bu mimari üzerine inşa edilen Qwen3-Next-80B-A3B-Base modeli 80 milyar parametreye sahiptir ancak yalnızca 3 milyarını aktif hale getirir ve Qwen3-32B yoğun modelle eşdeğer veya daha iyi performans sergiler. Özellikle, eğitim maliyetleri Qwen3-32B'nin onda birinden azdır ve 32k üzeri bağlamlarda çıkarım verimliliği on kattan fazla artarak hem eğitim hem de çıkarımda önemli maliyet etkinliği sunar.