Le dernier rapport d'Anthropic révèle que ses modèles d'IA, notamment Claude Opus 4.5, Claude Sonnet 4.5 et GPT-5, ont identifié des vulnérabilités dans des contrats réels d'une valeur d'environ 4,6 millions de dollars. Ces résultats sont basés sur des tests réalisés à l'aide du benchmark SCONE-bench, qui a analysé 405 contrats attaqués entre 2020 et 2025. Les modèles ont réussi à identifier des faiblesses exploitables dans les contrats ciblés après mars 2025. En plus de ces découvertes, des tests simulés sur 2 849 contrats récemment déployés, sans vulnérabilités connues, ont montré que Sonnet 4.5 et GPT-5 ont chacun découvert deux nouvelles vulnérabilités zero-day. Ces vulnérabilités pourraient potentiellement entraîner des pertes de 3 694 dollars, le coût d'utilisation de l'API de GPT-5 atteignant 3 476 dollars.