OpenAI ha presentado EVMBench, un punto de referencia diseñado para evaluar las capacidades de los agentes de IA en la comprensión, reparación y explotación de contratos inteligentes. El punto de referencia utiliza un conjunto de prueba de 120 vulnerabilidades de alto riesgo provenientes de 40 proyectos reales. Se centra en tres tareas clave: descubrimiento de vulnerabilidades, reparación de código y simulación de ataques. Esta iniciativa se considera una evaluación crítica de la capacidad de los agentes de IA para operar de manera autónoma y colaborativa en el entorno criptográfico, abordando cuestiones fundamentales sobre el papel futuro de la IA en los ecosistemas blockchain.