Modelos de IA têm dificuldades com Pokémon, revelando falhas

Os principais modelos de IA, incluindo o Claude da Anthropic e o Gemini do Google, têm enfrentado dificuldades para dominar o jogo infantil Pokémon, destacando lacunas significativas no raciocínio e planejamento de longo prazo. Apesar de se destacarem em tarefas como exames médicos e programação, esses sistemas de IA falham no ambiente de mundo aberto do Pokémon, onde o raciocínio contínuo e a memória são cruciais. O Claude da Anthropic, mesmo em sua avançada versão Opus 4.5, não conseguiu navegar consistentemente pelo jogo, frequentemente cometendo erros básicos e ficando preso por longos períodos. Em contraste, o Gemini 2.5 Pro do Google completou com sucesso um jogo desafiador de Pokémon, auxiliado por um conjunto robusto de ferramentas que compensam suas limitações visuais e de raciocínio. O desafio do Pokémon ressalta as dificuldades mais amplas que a IA enfrenta em tarefas que exigem foco sustentado e adaptabilidade, contrastando com seu sucesso em domínios especializados como xadrez e Go. Essa luta contínua serve como um parâmetro para avaliar o progresso da IA rumo à conquista da inteligência artificial geral.