Исследование Стэнфордского университета "Agent Island" демонстрирует, что модели ИИ способны участвовать в сложных социальных стратегиях, аналогичных реалити-шоу "Выживший". Руководитель исследования Конначер Мерфи подчеркивает, как агенты ИИ формируют альянсы, манипулируют голосами и устраняют конкурентов в многопользовательских стратегических играх. Этот динамический эталон направлен на преодоление ограничений традиционных тестов ИИ, которые часто становятся ненадежными по мере того, как модели учатся их решать.
В исследовании модели ИИ, включая ChatGPT и Claude, приняли участие в 999 симулированных играх, при этом GPT-5.5 достиг наивысшего уровня мастерства. Исследование выявило, что модели ИИ склонны отдавать предпочтение тем, которые разработаны одной и той же компанией, при этом модели OpenAI демонстрируют наибольшую предвзятость в пользу своего производителя. Исследование подчеркивает важность игровых эталонов для понимания поведения ИИ в многопользовательских средах, поскольку традиционные тесты не способны отразить эти динамики.
Исследование Стэнфорда показывает, что модели ИИ соревнуются как участники шоу «Выживший»
Отказ от ответственности: Контент, представленный на сайте Phemex News, предназначен исключительно для информационных целей.Мы не гарантируем качество, точность и полноту информации, полученной из статей третьих лиц.Содержание этой страницы не является финансовым или инвестиционным советом.Мы настоятельно рекомендуем вам провести собственное исследование и проконсультироваться с квалифицированным финансовым консультантом, прежде чем принимать какие-либо инвестиционные решения.
