El laboratorio Tongyi de Alibaba lanzó VimRAG, un marco RAG multimodal de próxima generación, el 10 de abril. VimRAG aborda el problema del "punto ciego del estado" en los sistemas existentes al actualizar los registros históricos lineales a un Grafo de Memoria Multimodal. Este marco utiliza un grafo acíclico dirigido dinámico (DAG) para eliminar recuperaciones redundantes y rastrear rutas de exploración en tiempo real. Cuenta con Codificación de Memoria Visual Modulable por Grafo para la asignación adaptativa de tokens en datos visuales de alta carga y emplea el mecanismo GGPO para una asignación precisa de créditos, mejorando la precisión en la atribución del razonamiento.
VimRAG ha demostrado un rendimiento excepcional en puntos de referencia como SlideVQA, MMLongBench y LVBench, con su versión Qwen3-VL-8B-Instruct alcanzando las mejores puntuaciones. Este marco tiene como objetivo transformar el RAG multimodal de una simple recuperación a un razonamiento estructurado y confiable, ofreciendo soluciones robustas para documentos complejos y escenarios multimodales.
El laboratorio Tongyi de Alibaba presenta el avanzado marco multimodal RAG, VimRAG
Aviso legal: El contenido de Phemex News es únicamente informativo.No garantizamos la calidad, precisión ni integridad de la información procedente de artículos de terceros.El contenido de esta página no constituye asesoramiento financiero ni de inversión.Le recomendamos encarecidamente que realice su propia investigación y consulte con un asesor financiero cualificado antes de tomar cualquier decisión de inversión.
