アリババのTongyi Labは、4月10日に次世代のマルチモーダルRAGフレームワークであるVimRAGを発表しました。VimRAGは、既存システムの「状態の盲点」問題に対処するため、線形の履歴記録をマルチモーダルメモリグラフにアップグレードしています。このフレームワークは、動的な有向非巡回グラフ(DAG)を使用して冗長な検索を排除し、探索経路をリアルタイムで追跡します。高負荷の視覚データに対して適応的なトークン割り当てを可能にするグラフ調整型視覚メモリエンコーディングを特徴とし、正確なクレジット割り当てのためにGGPOメカニズムを採用し、推論の帰属精度を向上させています。
VimRAGは、SlideVQA、MMLongBench、LVBenchなどのベンチマークで優れた性能を示しており、そのQwen3-VL-8B-Instructバージョンはトップスコアを達成しています。このフレームワークは、マルチモーダルRAGを単なる検索から構造化された信頼性の高い推論へと移行させ、複雑な文書やマルチモーダルシナリオに対して堅牢なソリューションを提供することを目指しています。
アリババのTongyiラボ、高度なマルチモーダルRAGフレームワーク「VimRAG」を発表
免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。
