Google Research a présenté ReasoningBank, un nouveau cadre de mémoire pour agents conçu pour améliorer les capacités d'apprentissage des agents d'IA en tirant parti des succès et des échecs passés. Lancé le 22 avril, ReasoningBank permet aux agents pilotés par de grands modèles de distiller leurs expériences en stratégies de raisonnement généralisées, qu'ils stockent dans une banque de mémoire pour l'exécution future des tâches. Cette approche améliore les méthodes précédentes en se concentrant sur les schémas de raisonnement plutôt que sur les séquences d'actions, en intégrant à la fois les expériences de tâches réussies et échouées.
Le cadre, détaillé dans un article publié à l'ICLR et disponible sur GitHub, inclut le Memory-aware Test-time Scaling (MaTTS) pour allouer des ressources informatiques supplémentaires lors de l'inférence. Cela permet aux agents d'explorer simultanément plusieurs trajectoires de tâches, affinant leurs stratégies par auto-comparaison. Lors des benchmarks, ReasoningBank a démontré un taux de réussite supérieur de 8,3 % sur les tâches WebArena et une amélioration de 4,6 % sur les tâches SWE-Bench-Verified par rapport aux bases sans mémoire, avec des améliorations supplémentaires lorsque MaTTS est appliqué.
Google dévoile ReasoningBank pour améliorer l'apprentissage par l'expérience de l'IA
Avertissement : Le contenu proposé sur Phemex News est à titre informatif uniquement. Nous ne garantissons pas la qualité, l'exactitude ou l'exhaustivité des informations provenant d'articles tiers. Ce contenu ne constitue pas un conseil financier ou d'investissement. Nous vous recommandons vivement d'effectuer vos propres recherches et de consulter un conseiller financier qualifié avant toute décision d'investissement.
