Компания Ramp Labs представила "Latent Briefing" — новый метод эффективного обмена памятью в системах с несколькими агентами, который значительно сокращает использование токенов до 65% без потери точности. Этот подход сжимает большие кеши KV моделей, что позволяет более эффективно разлагать задачи и выполнять их в архитектурах с несколькими агентами. На бенчмарке LongBench v2 метод показал снижение потребления токенов рабочими моделями на 65% и улучшение точности на 3 процентных пункта. Решение, протестированное на моделях Claude Sonnet 4 и Qwen3-14B, продемонстрировало более быстрое время обработки и адаптивность к различным типам документов.
Ramp Labs представляет эффективное решение для совместного использования памяти несколькими агентами
Отказ от ответственности: Контент, представленный на сайте Phemex News, предназначен исключительно для информационных целей.Мы не гарантируем качество, точность и полноту информации, полученной из статей третьих лиц.Содержание этой страницы не является финансовым или инвестиционным советом.Мы настоятельно рекомендуем вам провести собственное исследование и проконсультироваться с квалифицированным финансовым консультантом, прежде чем принимать какие-либо инвестиционные решения.
