セキュリティ企業のBlockSecは、EVMBenchの再テストを実施し、スマートコントラクト監査におけるAIの自動化能力の評価に異議を唱えました。26のモデル構成に拡大し、2026年2月以降の22件の実際の攻撃事例を取り入れた結果、BlockSecは110回のテストでAIが実際の攻撃を利用する成功率が0%であることを発見しました。しかし、脆弱性検出におけるAIの性能は元の報告と類似しており、一部のモデルは既知のパターン脆弱性を特定できました。