알리바바의 통이 랩은 4월 10일 차세대 멀티모달 RAG 프레임워크인 VimRAG를 출시했습니다. VimRAG는 기존 시스템에서 발생하는 "상태 맹점" 문제를 선형 이력 기록을 멀티모달 메모리 그래프로 업그레이드하여 해결합니다. 이 프레임워크는 동적 방향 비순환 그래프(DAG)를 사용하여 중복 검색을 제거하고 탐색 경로를 실시간으로 추적합니다. 또한, 고부하 시각 데이터에 적응적으로 토큰 할당을 수행하는 그래프 조절 시각 메모리 인코딩(Graph-Modulated Visual Memory Encoding)을 특징으로 하며, 정확한 크레딧 할당을 위한 GGPO 메커니즘을 적용하여 추론 귀속 정확도를 향상시킵니다.
VimRAG는 SlideVQA, MMLongBench, LVBench와 같은 벤치마크에서 뛰어난 성능을 입증했으며, Qwen3-VL-8B-Instruct 버전이 최고 점수를 기록했습니다. 이 프레임워크는 멀티모달 RAG를 단순 검색에서 구조화되고 신뢰할 수 있는 추론으로 전환하여 복잡한 문서와 멀티모달 시나리오에 강력한 솔루션을 제공하는 것을 목표로 합니다.
알리바바 통이 연구소, 첨단 멀티모달 RAG 프레임워크 'VimRAG' 공개
면책 조항: Phemex 뉴스에서 제공하는 콘텐츠는 정보 제공 목적으로만 제공됩니다. 제3자 기사에서 출처를 얻은 정보의 품질, 정확성 또는 완전성을 보장하지 않습니다.이 페이지의 콘텐츠는 재무 또는 투자 조언이 아닙니다.투자 결정을 내리기 전에 반드시 스스로 조사하고 자격을 갖춘 재무 전문가와 상담하시기 바랍니다.
