OpenAI đã giới thiệu EVMBench, một chuẩn đánh giá được thiết kế để đánh giá khả năng của các tác nhân AI trong việc hiểu, sửa chữa và khai thác các hợp đồng thông minh. Chuẩn đánh giá này sử dụng một bộ kiểm tra gồm 120 lỗ hổng rủi ro cao được lấy từ 40 dự án thực tế. Nó tập trung vào ba nhiệm vụ chính: phát hiện lỗ hổng, sửa mã và mô phỏng tấn công. Sáng kiến này được xem như một đánh giá quan trọng về khả năng hoạt động tự động và hợp tác của các tác nhân AI trong môi trường tiền mã hóa, giải quyết các vấn đề cơ bản về vai trò tương lai của AI trong các hệ sinh thái blockchain.