알리바바의 통이 랩은 4월 10일 차세대 멀티모달 RAG 프레임워크인 VimRAG를 출시했습니다. VimRAG는 기존 시스템에서 발생하는 "상태 맹점" 문제를 선형 이력 기록을 멀티모달 메모리 그래프로 업그레이드하여 해결합니다. 이 프레임워크는 동적 방향 비순환 그래프(DAG)를 사용하여 중복 검색을 제거하고 탐색 경로를 실시간으로 추적합니다. 또한, 고부하 시각 데이터에 적응적으로 토큰 할당을 수행하는 그래프 조절 시각 메모리 인코딩(Graph-Modulated Visual Memory Encoding)을 특징으로 하며, 정확한 크레딧 할당을 위한 GGPO 메커니즘을 적용하여 추론 귀속 정확도를 향상시킵니다. VimRAG는 SlideVQA, MMLongBench, LVBench와 같은 벤치마크에서 뛰어난 성능을 입증했으며, Qwen3-VL-8B-Instruct 버전이 최고 점수를 기록했습니다. 이 프레임워크는 멀티모달 RAG를 단순 검색에서 구조화되고 신뢰할 수 있는 추론으로 전환하여 복잡한 문서와 멀티모달 시나리오에 강력한 솔루션을 제공하는 것을 목표로 합니다.