Anthropicの最新レポートによると、Claude Opus 4.5、Claude Sonnet 4.5、GPT-5を含む同社のAIモデルは、実際の契約において約460万ドル相当の脆弱性を特定しました。これらの発見は、2020年から2025年の間に攻撃を受けた405件の契約を分析したSCONE-benchベンチマークを用いたテストに基づいています。これらのモデルは、2025年3月以降に標的とされた契約における悪用可能な弱点を正確に特定しました。 これらの発見に加え、既知の脆弱性がない2,849件の新規展開契約に対するシミュレーションテストでは、Sonnet 4.5とGPT-5がそれぞれ2件の新たなゼロデイ脆弱性を発見しました。これらの脆弱性は、最大3,694ドルの損失を引き起こす可能性があり、GPT-5のAPI使用コストは3,476ドルに達しています。