A Ramp Labs apresentou o "Latent Briefing", um novo método para compartilhamento eficiente de memória em sistemas multiagentes, reduzindo significativamente o uso de tokens em até 65% sem comprometer a precisão. A abordagem comprime grandes caches KV de modelos, permitindo uma decomposição e execução de tarefas mais eficiente em arquiteturas multiagentes. No benchmark LongBench v2, o método mostrou uma redução de 65% no consumo de tokens para modelos trabalhadores e melhorou a precisão em 3 pontos percentuais. A solução, testada com os modelos Claude Sonnet 4 e Qwen3-14B, demonstrou tempos de processamento mais rápidos e adaptabilidade a vários tipos de documentos.
Ramp Labs Lança Solução Eficiente de Compartilhamento de Memória entre Múltiplos Agentes
Aviso Legal: O conteúdo disponibilizado no Phemex News é apenas para fins informativos. Não garantimos a qualidade, precisão ou integridade das informações provenientes de artigos de terceiros. Este conteúdo não constitui aconselhamento financeiro ou de investimento. Recomendamos fortemente que você realize suas próprias pesquisas e consulte um consultor financeiro qualificado antes de tomar decisões de investimento.
