Ведущие модели ИИ, включая Claude от Anthropic и Gemini от Google, испытывают трудности с освоением детской игры Pokémon, что выявляет значительные пробелы в долгосрочном рассуждении и планировании. Несмотря на успехи в таких задачах, как медицинские экзамены и программирование, эти системы ИИ слабо справляются с открытым миром Pokémon, где критически важны непрерывное мышление и память.
Claude от Anthropic, даже в своей продвинутой версии Opus 4.5, не смог стабильно проходить игру, часто допуская базовые ошибки и застревая на длительные периоды. В то же время Gemini 2.5 Pro от Google успешно завершил сложную игру Pokémon, благодаря мощному набору инструментов, компенсирующих его визуальные и логические ограничения.
Вызов Pokémon подчеркивает более широкие трудности, с которыми сталкивается ИИ в задачах, требующих устойчивого внимания и адаптивности, что контрастирует с его успехами в специализированных областях, таких как шахматы и го. Эта постоянная борьба служит ориентиром для оценки прогресса ИИ на пути к достижению общего искусственного интеллекта.
Модели ИИ испытывают трудности с покемонами, выявляя пробелы в долгосрочном рассуждении
Отказ от ответственности: Контент, представленный на сайте Phemex News, предназначен исключительно для информационных целей.Мы не гарантируем качество, точность и полноту информации, полученной из статей третьих лиц.Содержание этой страницы не является финансовым или инвестиционным советом.Мы настоятельно рекомендуем вам провести собственное исследование и проконсультироваться с квалифицированным финансовым консультантом, прежде чем принимать какие-либо инвестиционные решения.
