OpenAI, yapay zeka ajanlarının akıllı sözleşmeleri anlama, onarma ve kullanma yeteneklerini değerlendirmek için tasarlanmış bir kıyaslama aracı olan EVMBench'i tanıttı. Bu kıyaslama, 40 gerçek dünya projesinden alınan 120 yüksek riskli güvenlik açığı test setini kullanıyor. Üç ana göreve odaklanıyor: güvenlik açığı keşfi, kod onarımı ve saldırı simülasyonu. Bu girişim, yapay zeka ajanlarının kripto ortamında özerk ve işbirlikçi şekilde çalışma yeteneklerinin kritik bir değerlendirmesi olarak görülüyor ve yapay zekanın blok zinciri ekosistemlerindeki gelecekteki rolüne dair temel sorunları ele alıyor.