Alibaba đã giới thiệu kiến trúc mô hình AI mới nhất của mình, Qwen3-Next, thông qua bộ phận Tongyi Qianwen. Mô hình mới, Qwen3-Next-80B-A3B, được mở mã nguồn và có những cải tiến đáng kể so với kiến trúc Qwen3 MoE trước đó. Những cải tiến chính bao gồm cơ chế chú ý lai, cấu trúc MoE rất thưa thớt và cơ chế dự đoán đa token, tất cả đều góp phần vào việc suy luận hiệu quả hơn.
Mô hình Qwen3-Next-80B-A3B-Base, xây dựng trên kiến trúc này, có 80 tỷ tham số nhưng chỉ kích hoạt 3 tỷ, đạt hiệu suất tương đương hoặc tốt hơn mô hình Qwen3-32B dày đặc. Đáng chú ý, chi phí đào tạo của nó thấp hơn một phần mười so với Qwen3-32B, và thông lượng suy luận cho các ngữ cảnh trên 32k cao hơn gấp hơn mười lần, mang lại hiệu quả chi phí đáng kể cả trong đào tạo và suy luận.
Alibaba Ra Mắt Mô Hình AI Qwen3-Next Tiên Tiến với Hiệu Suất Nâng Cao
Tuyên bố miễn trừ trách nhiệm: Nội dung được cung cấp trên Phemex News chỉ nhằm mục đích cung cấp thông tin.Chúng tôi không đảm bảo chất lượng, độ chính xác hoặc tính đầy đủ của thông tin có nguồn từ các bài viết của bên thứ ba.Nội dung trên trang này không cấu thành lời khuyên về tài chính hoặc đầu tư.Chúng tôi đặc biệt khuyến khích bạn tự tiến hành nghiên cứu và tham khảo ý kiến của cố vấn tài chính đủ tiêu chuẩn trước khi đưa ra bất kỳ quyết định đầu tư nào.