Ramp Labsは、「Latent Briefing」という新しい手法を発表しました。これはマルチエージェントシステムにおける効率的なメモリ共有を実現し、精度を損なうことなくトークン使用量を最大65%削減します。この手法は大規模モデルのKVキャッシュを圧縮し、マルチエージェントアーキテクチャにおけるタスクの分解と実行をより効率的にします。LongBench v2ベンチマークでは、この方法によりワーカーモデルのトークン消費が65%削減され、精度が3ポイント向上しました。Claude Sonnet 4およびQwen3-14Bモデルでテストされたこのソリューションは、処理速度の向上とさまざまな文書タイプへの適応性を示しました。