OpenAI a présenté EVMBench, un benchmark conçu pour évaluer les capacités des agents d'IA à comprendre, réparer et exploiter les contrats intelligents. Ce benchmark utilise un ensemble de test composé de 120 vulnérabilités à haut risque provenant de 40 projets réels. Il se concentre sur trois tâches clés : la découverte de vulnérabilités, la réparation de code et la simulation d'attaques. Cette initiative est considérée comme une évaluation cruciale de la capacité des agents d'IA à fonctionner de manière autonome et collaborative dans l'environnement crypto, abordant des questions fondamentales sur le rôle futur de l'IA dans les écosystèmes blockchain.