Alibaba'nın PAI ekibi, endüstriyel düzeyde araç çağrısı için tasarlanmış hafif bir ajan dil modeli olan AgenticQwen modelini, 8B ve 30B-A3B sürümleriyle açık kaynak olarak yayınladı. Yenilikçi "çift veri volanı" takviyeli öğrenme çerçevesini kullanan model, çıkarım maliyetlerini azaltarak büyük modellerle benzer yetenekler sunuyor. Çift volan yaklaşımı, karmaşık karar verme senaryoları üreterek ve model hatalarından öğrenerek performansı artırıyor.
AgenticQwen-8B, TAU-2 ve BFCL-V4 gibi kıyaslama testlerinde ortalama 47,4 puan alarak temel Qwen3-8B modelini geride bırakıyor ve Qwen3-235B modeline yaklaşıyor. Sadece 3 milyar parametreyi aktive eden 30B-A3B sürümü ise 50,2 puan elde ediyor. Başarısına rağmen, modelin 40K bağlam uzunluğu sınırlaması derin arama görevlerinde zorluklar yaratıyor. Model, Alibaba'nın dahili sistemlerinde halihazırda kullanılıyor ve daha kısa çıkarım süreleriyle geliştirilmiş performans sunuyor.
Alibaba'nın PAI Ekibi, Çift Veri Döngüsüne Sahip AgenticQwen Modelini Açık Kaynak Yaptı
Sorumluluk Reddi: Phemex Haberler'de sunulan içerik yalnızca bilgilendirme amaçlıdır. Üçüncü taraf makalelerden alınan bilgilerin kalitesi, doğruluğu veya eksiksizliğini garanti etmiyoruz. Bu sayfadaki içerik finansal veya yatırım tavsiyesi niteliği taşımaz. Yatırım kararları vermeden önce kendi araştırmanızı yapmanızı ve nitelikli bir finans danışmanına başvurmanızı şiddetle tavsiye ederiz.
