램프 랩스, 효율적인 다중 에이전트 메모리 공유 솔루션 공개

Ramp Labs는 다중 에이전트 시스템에서 효율적인 메모리 공유를 위한 새로운 방법인 "Latent Briefing"을 도입했습니다. 이 방법은 정확도를 저해하지 않으면서 토큰 사용량을 최대 65%까지 크게 줄입니다. 이 접근법은 대규모 모델 KV 캐시를 압축하여 다중 에이전트 아키텍처에서 작업 분해 및 실행을 보다 효율적으로 수행할 수 있게 합니다. LongBench v2 벤치마크에서 이 방법은 작업자 모델의 토큰 소비를 65% 줄였으며 정확도는 3퍼센트포인트 향상시켰습니다. Claude Sonnet 4 및 Qwen3-14B 모델로 테스트된 이 솔루션은 더 빠른 처리 시간과 다양한 문서 유형에 대한 적응성을 보여주었습니다.

출처: 원본 보기

면책 조항: Phemex 뉴스에서 제공하는 콘텐츠는 정보 제공 목적으로만 제공됩니다. 제3자 기사에서 출처를 얻은 정보의 품질, 정확성 또는 완전성을 보장하지 않습니다.이 페이지의 콘텐츠는 재무 또는 투자 조언이 아닙니다.투자 결정을 내리기 전에 반드시 스스로 조사하고 자격을 갖춘 재무 전문가와 상담하시기 바랍니다.

함께 보면 좋은 콘텐츠