10 апреля лаборатория Tongyi компании Alibaba представила VimRAG — многофункциональную RAG-систему нового поколения. VimRAG решает проблему «слепой зоны состояния» в существующих системах, обновляя линейные исторические записи до мультимодального графа памяти. Эта система использует динамический ориентированный ацикличный граф (DAG) для устранения избыточного поиска и отслеживания путей исследования в реальном времени. В ней реализовано граф-модулированное кодирование визуальной памяти для адаптивного распределения токенов при высокой нагрузке визуальных данных, а также применяется механизм GGPO для точного распределения заслуг, что повышает точность атрибуции рассуждений.
VimRAG продемонстрировала выдающиеся результаты на таких тестах, как SlideVQA, MMLongBench и LVBench, при этом версия Qwen3-VL-8B-Instruct достигла наивысших баллов. Эта система направлена на переход мультимодального RAG от простого поиска к структурированному и надежному рассуждению, предлагая надежные решения для работы со сложными документами и мультимодальными сценариями.
Лаборатория Tongyi компании Alibaba представила продвинутую мультимодальную RAG-систему VimRAG
Отказ от ответственности: Контент, представленный на сайте Phemex News, предназначен исключительно для информационных целей.Мы не гарантируем качество, точность и полноту информации, полученной из статей третьих лиц.Содержание этой страницы не является финансовым или инвестиционным советом.Мы настоятельно рекомендуем вам провести собственное исследование и проконсультироваться с квалифицированным финансовым консультантом, прежде чем принимать какие-либо инвестиционные решения.
