Nhóm PAI của Alibaba đã phát hành mô hình AgenticQwen, một mô hình ngôn ngữ đại lý nhẹ được thiết kế để gọi công cụ cấp công nghiệp, hiện đã được mã nguồn mở với các phiên bản 8B và 30B-A3B. Sử dụng khung học tăng cường "bánh đà dữ liệu kép" mới, mô hình đạt được khả năng tương tự các mô hình lớn với chi phí suy luận giảm. Phương pháp bánh đà kép cải thiện hiệu suất bằng cách tạo ra các kịch bản ra quyết định phức tạp và cải thiện từ các lỗi của mô hình. AgenticQwen-8B đạt điểm trung bình 47,4 trên các chuẩn đánh giá như TAU-2 và BFCL-V4, vượt trội hơn so với Qwen3-8B cơ bản và tiến gần đến mô hình Qwen3-235B. Phiên bản 30B-A3B, chỉ kích hoạt 3 tỷ tham số, đạt điểm 50,2. Mặc dù thành công, giới hạn độ dài ngữ cảnh 40K của mô hình gây ra thách thức trong các nhiệm vụ tìm kiếm sâu. Mô hình đã được sử dụng trong các hệ thống nội bộ của Alibaba, mang lại hiệu suất cải thiện với thời gian suy luận ngắn hơn.