A OpenAI lançou o EVMBench, um benchmark projetado para avaliar as capacidades dos agentes de IA em entender, reparar e explorar contratos inteligentes. O benchmark utiliza um conjunto de teste com 120 vulnerabilidades de alto risco provenientes de 40 projetos do mundo real. Ele se concentra em três tarefas principais: descoberta de vulnerabilidades, reparo de código e simulação de ataques. Esta iniciativa é vista como uma avaliação crítica da capacidade dos agentes de IA de operar de forma autônoma e colaborativa no ambiente cripto, abordando questões fundamentais sobre o papel futuro da IA nos ecossistemas de blockchain.