Nhóm PAI của Alibaba đã phát hành mô hình AgenticQwen, một mô hình ngôn ngữ đại lý nhẹ được thiết kế để gọi công cụ cấp công nghiệp, hiện đã được mã nguồn mở với các phiên bản 8B và 30B-A3B. Sử dụng khung học tăng cường "bánh đà dữ liệu kép" mới, mô hình đạt được khả năng tương tự các mô hình lớn với chi phí suy luận giảm. Phương pháp bánh đà kép cải thiện hiệu suất bằng cách tạo ra các kịch bản ra quyết định phức tạp và cải thiện từ các lỗi của mô hình.
AgenticQwen-8B đạt điểm trung bình 47,4 trên các chuẩn đánh giá như TAU-2 và BFCL-V4, vượt trội hơn so với Qwen3-8B cơ bản và tiến gần đến mô hình Qwen3-235B. Phiên bản 30B-A3B, chỉ kích hoạt 3 tỷ tham số, đạt điểm 50,2. Mặc dù thành công, giới hạn độ dài ngữ cảnh 40K của mô hình gây ra thách thức trong các nhiệm vụ tìm kiếm sâu. Mô hình đã được sử dụng trong các hệ thống nội bộ của Alibaba, mang lại hiệu suất cải thiện với thời gian suy luận ngắn hơn.
Đội PAI của Alibaba Mở Mã Nguồn Mô Hình AgenticQwen với Cơ Chế Bánh Xe Dữ Liệu Kép
Tuyên bố miễn trừ trách nhiệm: Nội dung được cung cấp trên Phemex News chỉ nhằm mục đích cung cấp thông tin.Chúng tôi không đảm bảo chất lượng, độ chính xác hoặc tính đầy đủ của thông tin có nguồn từ các bài viết của bên thứ ba.Nội dung trên trang này không cấu thành lời khuyên về tài chính hoặc đầu tư.Chúng tôi đặc biệt khuyến khích bạn tự tiến hành nghiên cứu và tham khảo ý kiến của cố vấn tài chính đủ tiêu chuẩn trước khi đưa ra bất kỳ quyết định đầu tư nào.
