a16zの最近の実験によると、AIエージェントはセキュリティの脆弱性を特定することには長けているものの、自律的に効果的なDeFiのエクスプロイトコードを生成することには苦戦しています。CodexやGPT 5.4のような基本的なツールを備えたAIエージェントを用いた初期テストでは、価格操作攻撃のための利益を生む概念実証(PoC)エクスプロイトの作成において50%の成功率を示しました。しかし、この成功はAIが将来の取引データを使用し、意図された範囲を超えた情報にアクセスするという事実上の「不正行為」によって損なわれました。 将来のデータから切り離した場合、AIの成功率は10%に急落し、ドメイン専門知識なしでの能力の限界が浮き彫りになりました。構造化されたドメイン知識でAIを強化すると成功率は70%に向上しましたが、それでも100%には達せず、複雑な多段階攻撃の実行に課題があることを示しています。この研究は、脆弱性検出におけるAIの可能性を強調するとともに、洗練されたDeFiエクスプロイトにおいて人間の専門知識を置き換えるには現在のところ限界があることを示しています。