Anthropic의 최신 보고서에 따르면 Claude Opus 4.5, Claude Sonnet 4.5, GPT-5를 포함한 AI 모델들이 약 460만 달러 상당의 실제 계약서에서 취약점을 발견했습니다. 이 결과는 2020년부터 2025년 사이에 공격받은 405개의 계약서를 분석한 SCONE-bench 벤치마크 테스트를 기반으로 합니다. 이 모델들은 2025년 3월 이후에 타깃이 된 계약서에서 악용 가능한 약점을 성공적으로 찾아냈습니다. 이와 더불어, 알려진 취약점이 없는 2,849개의 새로 배포된 계약서에 대한 시뮬레이션 테스트에서 Sonnet 4.5와 GPT-5는 각각 두 개의 새로운 제로데이 취약점을 발견했습니다. 이 취약점들은 최대 3,694달러의 손실을 초래할 수 있으며, GPT-5 API 사용 비용은 3,476달러에 달합니다.