Ramp Labs hat "Latent Briefing" vorgestellt, eine neue Methode für effizientes Speichermanagement in Multi-Agenten-Systemen, die den Tokenverbrauch um bis zu 65 % reduziert, ohne die Genauigkeit zu beeinträchtigen. Der Ansatz komprimiert große KV-Caches von Modellen, was eine effizientere Aufgabenzerlegung und -ausführung in Multi-Agenten-Architekturen ermöglicht. Im LongBench v2 Benchmark zeigte die Methode eine Reduktion des Tokenverbrauchs bei Arbeitsmodellen um 65 % und verbesserte die Genauigkeit um 3 Prozentpunkte. Die Lösung, getestet mit den Modellen Claude Sonnet 4 und Qwen3-14B, zeigte schnellere Verarbeitungszeiten und Anpassungsfähigkeit an verschiedene Dokumenttypen.
Ramp Labs stellt effiziente Lösung für gemeinsames Gedächtnis mehrerer Agenten vor
Haftungsausschluss: Die auf Phemex News bereitgestellten Inhalte dienen nur zu Informationszwecken.Wir garantieren nicht die Qualität, Genauigkeit oder Vollständigkeit der Informationen aus Drittquellen.Die Inhalte auf dieser Seite stellen keine Finanz- oder Anlageberatung dar.Wir empfehlen dringend, eigene Recherchen durchzuführen und einen qualifizierten Finanzberater zu konsultieren, bevor Sie Anlageentscheidungen treffen.
