Ramp Labs ha presentado "Latent Briefing", un nuevo método para el intercambio eficiente de memoria en sistemas multiagente, que reduce significativamente el uso de tokens hasta en un 65% sin comprometer la precisión. El enfoque comprime grandes cachés KV de modelos, permitiendo una descomposición y ejecución de tareas más eficiente en arquitecturas multiagente. En el benchmark LongBench v2, el método mostró una reducción del 65% en el consumo de tokens para los modelos trabajadores y mejoró la precisión en 3 puntos porcentuales. La solución, probada con los modelos Claude Sonnet 4 y Qwen3-14B, demostró tiempos de procesamiento más rápidos y adaptabilidad a diversos tipos de documentos.
Ramp Labs presenta una solución eficiente para compartir memoria entre múltiples agentes
Aviso legal: El contenido de Phemex News es únicamente informativo.No garantizamos la calidad, precisión ni integridad de la información procedente de artículos de terceros.El contenido de esta página no constituye asesoramiento financiero ni de inversión.Le recomendamos encarecidamente que realice su propia investigación y consulte con un asesor financiero cualificado antes de tomar cualquier decisión de inversión.
