ИИ испытывают трудности с Покемонами, выявляя пробелы в логике

Ведущие модели ИИ, включая Claude от Anthropic и Gemini от Google, испытывают трудности с освоением детской игры Pokémon, что выявляет значительные пробелы в долгосрочном рассуждении и планировании. Несмотря на успехи в таких задачах, как медицинские экзамены и программирование, эти системы ИИ слабо справляются с открытым миром Pokémon, где критически важны непрерывное мышление и память. Claude от Anthropic, даже в своей продвинутой версии Opus 4.5, не смог стабильно проходить игру, часто допуская базовые ошибки и застревая на длительные периоды. В то же время Gemini 2.5 Pro от Google успешно завершил сложную игру Pokémon, благодаря мощному набору инструментов, компенсирующих его визуальные и логические ограничения. Вызов Pokémon подчеркивает более широкие трудности, с которыми сталкивается ИИ в задачах, требующих устойчивого внимания и адаптивности, что контрастирует с его успехами в специализированных областях, таких как шахматы и го. Эта постоянная борьба служит ориентиром для оценки прогресса ИИ на пути к достижению общего искусственного интеллекта.