O relatório mais recente da Anthropic revela que seus modelos de IA, incluindo Claude Opus 4.5, Claude Sonnet 4.5 e GPT-5, identificaram vulnerabilidades em contratos do mundo real no valor aproximado de US$ 4,6 milhões. Essas descobertas foram baseadas em testes realizados usando o benchmark SCONE-bench, que analisou 405 contratos atacados entre 2020 e 2025. Os modelos conseguiram identificar com sucesso fraquezas exploráveis em contratos alvos após março de 2025. Além dessas descobertas, testes simulados em 2.849 contratos recém-implantados, sem vulnerabilidades conhecidas, mostraram que Sonnet 4.5 e GPT-5 descobriram cada um duas novas vulnerabilidades zero-day. Essas vulnerabilidades poderiam potencialmente levar a perdas de US$ 3.694, com o custo do uso da API do GPT-5 chegando a US$ 3.476.