OpenAI는 AI 에이전트가 스마트 계약을 이해하고, 수리하며, 악용하는 능력을 평가하기 위해 설계된 벤치마크인 EVMBench를 도입했습니다. 이 벤치마크는 40개의 실제 프로젝트에서 수집된 120개의 고위험 취약점 테스트 세트를 활용합니다. 주요 세 가지 작업인 취약점 발견, 코드 수리, 공격 시뮬레이션에 중점을 둡니다. 이 이니셔티브는 AI 에이전트가 암호화 환경에서 자율적이고 협력적으로 작동할 수 있는 능력을 평가하는 중요한 평가로 간주되며, 블록체인 생태계에서 AI의 미래 역할에 대한 근본적인 문제를 다룹니다.