OpenAI запускает EVMBench для оценки смарт-контрактов

OpenAI представила EVMBench — эталонный тест, предназначенный для оценки возможностей ИИ-агентов в понимании, исправлении и эксплуатации смарт-контрактов. В тестовом наборе используется 120 уязвимостей высокого риска, взятых из 40 реальных проектов. Тест фокусируется на трёх ключевых задачах: обнаружение уязвимостей, исправление кода и моделирование атак. Эта инициатива рассматривается как критическая оценка способности ИИ-агентов работать автономно и совместно в крипто-среде, затрагивая фундаментальные вопросы будущей роли ИИ в экосистемах блокчейна.

Вам также может понравиться