OpenAI hat EVMBench vorgestellt, einen Benchmark, der darauf ausgelegt ist, die Fähigkeiten von KI-Agenten im Verstehen, Reparieren und Ausnutzen von Smart Contracts zu bewerten. Der Benchmark verwendet einen Testsatz von 120 Hochrisiko-Schwachstellen, die aus 40 realen Projekten stammen. Er konzentriert sich auf drei Hauptaufgaben: Schwachstellenentdeckung, Code-Reparatur und Angriffssimulation. Diese Initiative wird als eine kritische Bewertung der Fähigkeit von KI-Agenten angesehen, autonom und kollaborativ im Krypto-Umfeld zu agieren, und adressiert grundlegende Fragen zur zukünftigen Rolle der KI in Blockchain-Ökosystemen.