Ramp Labsは、「Latent Briefing」という新しい手法を発表しました。これはマルチエージェントシステムにおける効率的なメモリ共有を実現し、精度を損なうことなくトークン使用量を最大65%削減します。この手法は大規模モデルのKVキャッシュを圧縮し、マルチエージェントアーキテクチャにおけるタスクの分解と実行をより効率的にします。LongBench v2ベンチマークでは、この方法によりワーカーモデルのトークン消費が65%削減され、精度が3ポイント向上しました。Claude Sonnet 4およびQwen3-14Bモデルでテストされたこのソリューションは、処理速度の向上とさまざまな文書タイプへの適応性を示しました。
Ramp Labs、効率的なマルチエージェントメモリ共有ソリューションを発表
免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。
