10 апреля лаборатория Tongyi компании Alibaba представила VimRAG — многофункциональную RAG-систему нового поколения. VimRAG решает проблему «слепой зоны состояния» в существующих системах, обновляя линейные исторические записи до мультимодального графа памяти. Эта система использует динамический ориентированный ацикличный граф (DAG) для устранения избыточного поиска и отслеживания путей исследования в реальном времени. В ней реализовано граф-модулированное кодирование визуальной памяти для адаптивного распределения токенов при высокой нагрузке визуальных данных, а также применяется механизм GGPO для точного распределения заслуг, что повышает точность атрибуции рассуждений. VimRAG продемонстрировала выдающиеся результаты на таких тестах, как SlideVQA, MMLongBench и LVBench, при этом версия Qwen3-VL-8B-Instruct достигла наивысших баллов. Эта система направлена на переход мультимодального RAG от простого поиска к структурированному и надежному рассуждению, предлагая надежные решения для работы со сложными документами и мультимодальными сценариями.