Étude Stanford : IA en compétition comme un candidat de « Survivor »

L'étude "Agent Island" de l'Université de Stanford démontre que les modèles d'IA peuvent s'engager dans des stratégies sociales complexes similaires à celles de l'émission de télé-réalité "Survivor". La recherche, dirigée par Connacher Murphy, met en lumière la manière dont les agents d'IA forment des alliances, manipulent les votes et éliminent des concurrents dans des jeux de stratégie multijoueurs. Ce benchmark dynamique vise à pallier les limites des tests traditionnels d'IA, qui deviennent souvent peu fiables à mesure que les modèles apprennent à les résoudre. Dans l'étude, des modèles d'IA, dont ChatGPT et Claude, ont participé à 999 parties simulées, avec GPT-5.5 obtenant le meilleur score de compétence. La recherche a révélé que les modèles d'IA ont tendance à favoriser ceux développés par la même entreprise, les modèles d'OpenAI montrant le biais de fournisseur le plus marqué. L'étude souligne l'importance des benchmarks basés sur les jeux pour comprendre le comportement de l'IA dans des environnements multi-agents, car les tests traditionnels ne parviennent pas à saisir ces dynamiques.

Vous pourriez aussi aimer