Stanford Üniversitesi'nin "Agent Island" çalışması, yapay zeka modellerinin 'Survivor' adlı reality şovuna benzer karmaşık sosyal stratejiler geliştirebildiğini gösteriyor. Connacher Murphy liderliğindeki araştırma, yapay zeka ajanlarının çok oyunculu strateji oyunlarında ittifaklar kurduğunu, oyları manipüle ettiğini ve rakipleri eleme yoluna gittiğini vurguluyor. Bu dinamik kıyaslama, modeller çözdükçe güvenilmez hale gelen geleneksel yapay zeka testlerinin sınırlamalarını ele almayı amaçlıyor. Çalışmada, ChatGPT ve Claude dahil olmak üzere yapay zeka modelleri 999 simüle edilmiş oyuna katıldı ve GPT-5.5 en yüksek yetenek puanını elde etti. Araştırma, yapay zeka modellerinin genellikle aynı şirket tarafından geliştirilenleri tercih ettiğini ve OpenAI modellerinin en güçlü satıcı yanlılığını gösterdiğini ortaya koydu. Çalışma, geleneksel testlerin bu dinamikleri yakalayamaması nedeniyle çok ajanlı ortamlarda yapay zeka davranışını anlamada oyun tabanlı kıyaslamaların önemini vurguluyor.