O Google Research apresentou o ReasoningBank, uma nova estrutura de memória para agentes projetada para aprimorar as capacidades de aprendizado de agentes de IA, aproveitando sucessos e falhas passadas. Lançado em 22 de abril, o ReasoningBank permite que agentes movidos por grandes modelos destilem experiências em estratégias de raciocínio generalizadas, armazenando-as em um banco de memória para execução futura de tarefas. Essa abordagem melhora os métodos anteriores ao focar em padrões de raciocínio em vez de sequências de ações, incorporando tanto experiências de tarefas bem-sucedidas quanto fracassadas. A estrutura, detalhada em um artigo publicado na ICLR e disponível no GitHub, inclui o Memory-aware Test-time Scaling (MaTTS) para alocar recursos computacionais adicionais durante a inferência. Isso permite que os agentes explorem múltiplas trajetórias de tarefas simultaneamente, refinando estratégias por meio de auto-comparação. Em benchmarks, o ReasoningBank demonstrou uma taxa de sucesso 8,3% maior em tarefas do WebArena e uma melhoria de 4,6% em tarefas do SWE-Bench-Verified em comparação com bases sem memória, com aprimoramentos adicionais quando o MaTTS é aplicado.