Ramp Labs, çok ajanlı sistemlerde verimli bellek paylaşımı için "Latent Briefing" adlı yeni bir yöntem tanıttı; bu yöntem, doğruluktan ödün vermeden token kullanımını %65'e kadar önemli ölçüde azaltıyor. Bu yaklaşım, büyük model KV önbelleklerini sıkıştırarak çok ajanlı mimarilerde görevlerin daha verimli şekilde parçalanmasına ve yürütülmesine olanak tanıyor. LongBench v2 kıyaslamasında, yöntem işçi modeller için token tüketiminde %65 azalma ve doğrulukta 3 puanlık artış gösterdi. Claude Sonnet 4 ve Qwen3-14B modelleriyle test edilen çözüm, daha hızlı işlem süreleri ve çeşitli belge türlerine uyarlanabilirlik sergiledi.
Ramp Labs Verimli Çoklu Ajan Bellek Paylaşım Çözümünü Tanıttı
Sorumluluk Reddi: Phemex Haberler'de sunulan içerik yalnızca bilgilendirme amaçlıdır. Üçüncü taraf makalelerden alınan bilgilerin kalitesi, doğruluğu veya eksiksizliğini garanti etmiyoruz. Bu sayfadaki içerik finansal veya yatırım tavsiyesi niteliği taşımaz. Yatırım kararları vermeden önce kendi araştırmanızı yapmanızı ve nitelikli bir finans danışmanına başvurmanızı şiddetle tavsiye ederiz.
