アリババは、同社の統一千文部門を通じて最新のAIモデルアーキテクチャ「Qwen3-Next」を発表しました。新モデル「Qwen3-Next-80B-A3B」はオープンソースであり、従来のQwen3 MoEアーキテクチャに比べて大幅な改良が施されています。主な改良点には、ハイブリッドアテンション機構、高度にスパース化されたMoE構造、そしてマルチトークン予測機構が含まれており、これらがより効率的な推論に寄与しています。
このアーキテクチャに基づくQwen3-Next-80B-A3B-Baseモデルは、800億のパラメータを持ちながらも、3億のみを活性化し、Qwen3-32Bの密なモデルと同等かそれ以上の性能を達成しています。特に、トレーニングコストはQwen3-32Bの十分の一未満であり、32kを超えるコンテキストにおける推論スループットは10倍以上で、トレーニングと推論の両面で大幅なコスト効率を提供しています。
アリババ、効率性を強化した先進的なQwen3-Next AIモデルを発表
免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。