Os principais modelos de IA, incluindo o Claude da Anthropic e o Gemini do Google, têm enfrentado dificuldades para dominar o jogo infantil Pokémon, destacando lacunas significativas no raciocínio e planejamento de longo prazo. Apesar de se destacarem em tarefas como exames médicos e programação, esses sistemas de IA falham no ambiente de mundo aberto do Pokémon, onde o raciocínio contínuo e a memória são cruciais.
O Claude da Anthropic, mesmo em sua avançada versão Opus 4.5, não conseguiu navegar consistentemente pelo jogo, frequentemente cometendo erros básicos e ficando preso por longos períodos. Em contraste, o Gemini 2.5 Pro do Google completou com sucesso um jogo desafiador de Pokémon, auxiliado por um conjunto robusto de ferramentas que compensam suas limitações visuais e de raciocínio.
O desafio do Pokémon ressalta as dificuldades mais amplas que a IA enfrenta em tarefas que exigem foco sustentado e adaptabilidade, contrastando com seu sucesso em domínios especializados como xadrez e Go. Essa luta contínua serve como um parâmetro para avaliar o progresso da IA rumo à conquista da inteligência artificial geral.
Modelos de IA têm dificuldades com Pokémon, revelando lacunas no raciocínio de longo prazo
Aviso Legal: O conteúdo disponibilizado no Phemex News é apenas para fins informativos. Não garantimos a qualidade, precisão ou integridade das informações provenientes de artigos de terceiros. Este conteúdo não constitui aconselhamento financeiro ou de investimento. Recomendamos fortemente que você realize suas próprias pesquisas e consulte um consultor financeiro qualificado antes de tomar decisões de investimento.
