El laboratorio Tongyi de Alibaba lanzó VimRAG, un marco RAG multimodal de próxima generación, el 10 de abril. VimRAG aborda el problema del "punto ciego del estado" en los sistemas existentes al actualizar los registros históricos lineales a un Grafo de Memoria Multimodal. Este marco utiliza un grafo acíclico dirigido dinámico (DAG) para eliminar recuperaciones redundantes y rastrear rutas de exploración en tiempo real. Cuenta con Codificación de Memoria Visual Modulable por Grafo para la asignación adaptativa de tokens en datos visuales de alta carga y emplea el mecanismo GGPO para una asignación precisa de créditos, mejorando la precisión en la atribución del razonamiento. VimRAG ha demostrado un rendimiento excepcional en puntos de referencia como SlideVQA, MMLongBench y LVBench, con su versión Qwen3-VL-8B-Instruct alcanzando las mejores puntuaciones. Este marco tiene como objetivo transformar el RAG multimodal de una simple recuperación a un razonamiento estructurado y confiable, ofreciendo soluciones robustas para documentos complejos y escenarios multimodales.