Google Research a présenté ReasoningBank, un nouveau cadre de mémoire pour agents conçu pour améliorer les capacités d'apprentissage des agents d'IA en tirant parti des succès et des échecs passés. Lancé le 22 avril, ReasoningBank permet aux agents pilotés par de grands modèles de distiller leurs expériences en stratégies de raisonnement généralisées, qu'ils stockent dans une banque de mémoire pour l'exécution future des tâches. Cette approche améliore les méthodes précédentes en se concentrant sur les schémas de raisonnement plutôt que sur les séquences d'actions, en intégrant à la fois les expériences de tâches réussies et échouées. Le cadre, détaillé dans un article publié à l'ICLR et disponible sur GitHub, inclut le Memory-aware Test-time Scaling (MaTTS) pour allouer des ressources informatiques supplémentaires lors de l'inférence. Cela permet aux agents d'explorer simultanément plusieurs trajectoires de tâches, affinant leurs stratégies par auto-comparaison. Lors des benchmarks, ReasoningBank a démontré un taux de réussite supérieur de 8,3 % sur les tâches WebArena et une amélioration de 4,6 % sur les tâches SWE-Bench-Verified par rapport aux bases sans mémoire, avec des améliorations supplémentaires lorsque MaTTS est appliqué.