Ramp Labs ha presentado "Latent Briefing", un nuevo método para el intercambio eficiente de memoria en sistemas multiagente, que reduce significativamente el uso de tokens hasta en un 65% sin comprometer la precisión. El enfoque comprime grandes cachés KV de modelos, permitiendo una descomposición y ejecución de tareas más eficiente en arquitecturas multiagente. En el benchmark LongBench v2, el método mostró una reducción del 65% en el consumo de tokens para los modelos trabajadores y mejoró la precisión en 3 puntos porcentuales. La solución, probada con los modelos Claude Sonnet 4 y Qwen3-14B, demostró tiempos de procesamiento más rápidos y adaptabilidad a diversos tipos de documentos.