Google Research представила ReasoningBank — новую систему памяти для агентов, разработанную для улучшения обучаемости ИИ-агентов за счёт использования прошлых успехов и неудач. Выпущенная 22 апреля, ReasoningBank позволяет агентам на основе крупных моделей обобщать опыт в универсальные стратегии рассуждений и сохранять их в банке памяти для последующего выполнения задач. Этот подход превосходит предыдущие методы, сосредотачиваясь на шаблонах рассуждений, а не на последовательностях действий, учитывая как успешный, так и неудачный опыт выполнения задач.
Данная система, подробно описанная в статье, опубликованной на конференции ICLR и доступной на GitHub, включает Memory-aware Test-time Scaling (MaTTS) — механизм выделения дополнительных вычислительных ресурсов во время инференса. Это позволяет агентам одновременно исследовать несколько траекторий решения задач, совершенствуя стратегии через самоанализ. В тестах ReasoningBank показала на 8,3% более высокий уровень успешности на задачах WebArena и на 4,6% улучшение на задачах SWE-Bench-Verified по сравнению с базовыми моделями без памяти, с дополнительным приростом при использовании MaTTS.
Google представила ReasoningBank для улучшения обучения ИИ на основе опыта
Отказ от ответственности: Контент, представленный на сайте Phemex News, предназначен исключительно для информационных целей.Мы не гарантируем качество, точность и полноту информации, полученной из статей третьих лиц.Содержание этой страницы не является финансовым или инвестиционным советом.Мы настоятельно рекомендуем вам провести собственное исследование и проконсультироваться с квалифицированным финансовым консультантом, прежде чем принимать какие-либо инвестиционные решения.
