Alibaba'nın Tongyi Laboratuvarı, 10 Nisan'da yeni nesil çok modlu RAG çerçevesi VimRAG'i tanıttı. VimRAG, mevcut sistemlerdeki "durum kör noktası" sorununu, doğrusal tarihsel kayıtları Çok Modlu Bellek Grafiği'ne yükselterek çözüyor. Bu çerçeve, gereksiz sorgulamaları ortadan kaldırmak ve keşif yollarını gerçek zamanlı izlemek için dinamik yönlendirilmiş döngüsüz grafik (DAG) kullanıyor. Yüksek yoğunluklu görsel verilerde uyarlanabilir token tahsisi için Grafik Modülasyonlu Görsel Bellek Kodlaması özelliğine sahip ve kesin kredi ataması için GGPO mekanizmasını kullanarak akıl yürütme atıf doğruluğunu artırıyor. VimRAG, SlideVQA, MMLongBench ve LVBench gibi kıyaslama testlerinde olağanüstü performans sergiledi ve Qwen3-VL-8B-Instruct versiyonu en yüksek puanları elde etti. Bu çerçeve, çok modlu RAG'i basit sorgulamadan yapılandırılmış, güvenilir akıl yürütmeye dönüştürmeyi hedefleyerek karmaşık belgeler ve çok modlu senaryolar için sağlam çözümler sunuyor.