Phòng thí nghiệm Tongyi của Alibaba đã ra mắt VimRAG, một khung RAG đa phương tiện thế hệ mới, vào ngày 10 tháng 4. VimRAG giải quyết vấn đề "điểm mù trạng thái" trong các hệ thống hiện có bằng cách nâng cấp các bản ghi lịch sử tuyến tính thành Đồ thị Bộ nhớ Đa phương tiện. Khung này sử dụng đồ thị có hướng không chu trình động (DAG) để loại bỏ việc truy xuất dư thừa và theo dõi các đường khám phá theo thời gian thực. Nó có tính năng Mã hóa Bộ nhớ Thị giác Điều chỉnh theo Đồ thị để phân bổ token thích ứng trong dữ liệu hình ảnh tải cao và sử dụng cơ chế GGPO để phân bổ tín dụng chính xác, nâng cao độ chính xác trong việc xác định nguyên nhân suy luận.
VimRAG đã thể hiện hiệu suất xuất sắc trên các tiêu chuẩn như SlideVQA, MMLongBench và LVBench, với phiên bản Qwen3-VL-8B-Instruct đạt điểm cao nhất. Khung này nhằm mục đích chuyển đổi RAG đa phương tiện từ việc truy xuất đơn giản sang suy luận có cấu trúc và đáng tin cậy, cung cấp các giải pháp mạnh mẽ cho các tài liệu phức tạp và các kịch bản đa phương tiện.
Phòng thí nghiệm Tongyi của Alibaba ra mắt khung RAG đa phương tiện tiên tiến, VimRAG
Tuyên bố miễn trừ trách nhiệm: Nội dung được cung cấp trên Phemex News chỉ nhằm mục đích cung cấp thông tin.Chúng tôi không đảm bảo chất lượng, độ chính xác hoặc tính đầy đủ của thông tin có nguồn từ các bài viết của bên thứ ba.Nội dung trên trang này không cấu thành lời khuyên về tài chính hoặc đầu tư.Chúng tôi đặc biệt khuyến khích bạn tự tiến hành nghiên cứu và tham khảo ý kiến của cố vấn tài chính đủ tiêu chuẩn trước khi đưa ra bất kỳ quyết định đầu tư nào.
