OpenAIは、AIエージェントがスマートコントラクトを理解し、修復し、悪用する能力を評価するために設計されたベンチマーク「EVMBench」を導入しました。このベンチマークは、40の実際のプロジェクトから収集された120件の高リスク脆弱性のテストセットを利用しています。主に3つの重要なタスク、すなわち脆弱性の発見、コードの修復、攻撃のシミュレーションに焦点を当てています。この取り組みは、AIエージェントが暗号環境内で自律的かつ協調的に機能する能力を評価する重要な試みと見なされており、ブロックチェーンエコシステムにおけるAIの将来的な役割に関する根本的な問題に取り組んでいます。