Google Research представила ReasoningBank — новую систему памяти для агентов, разработанную для улучшения обучаемости ИИ-агентов за счёт использования прошлых успехов и неудач. Выпущенная 22 апреля, ReasoningBank позволяет агентам на основе крупных моделей обобщать опыт в универсальные стратегии рассуждений и сохранять их в банке памяти для последующего выполнения задач. Этот подход превосходит предыдущие методы, сосредотачиваясь на шаблонах рассуждений, а не на последовательностях действий, учитывая как успешный, так и неудачный опыт выполнения задач. Данная система, подробно описанная в статье, опубликованной на конференции ICLR и доступной на GitHub, включает Memory-aware Test-time Scaling (MaTTS) — механизм выделения дополнительных вычислительных ресурсов во время инференса. Это позволяет агентам одновременно исследовать несколько траекторий решения задач, совершенствуя стратегии через самоанализ. В тестах ReasoningBank показала на 8,3% более высокий уровень успешности на задачах WebArena и на 4,6% улучшение на задачах SWE-Bench-Verified по сравнению с базовыми моделями без памяти, с дополнительным приростом при использовании MaTTS.