Công ty an ninh BlockSec đã tiến hành kiểm tra lại EVMBench, thách thức đánh giá về khả năng tự động hóa của AI trong việc kiểm toán hợp đồng thông minh. Bằng cách mở rộng lên 26 cấu hình mô hình và kết hợp 22 sự cố tấn công thực tế từ tháng 2 năm 2026 trở đi, BlockSec phát hiện rằng AI có tỷ lệ thành công 0% trong việc khai thác các cuộc tấn công thực tế qua 110 bài kiểm tra. Tuy nhiên, hiệu suất của AI trong việc phát hiện lỗ hổng tương tự như báo cáo ban đầu, với một số mô hình có thể nhận diện các lỗ hổng theo mẫu đã biết.