Последний отчет компании Anthropic показывает, что её модели искусственного интеллекта, включая Claude Opus 4.5, Claude Sonnet 4.5 и GPT-5, выявили уязвимости в реальных контрактах на сумму примерно 4,6 миллиона долларов. Эти данные основаны на тестах, проведённых с использованием эталона SCONE-bench, который проанализировал 405 контрактов, подвергшихся атакам в период с 2020 по 2025 годы. Модели успешно обнаружили эксплуатируемые слабые места в контрактах, нацеленных после марта 2025 года. Кроме того, в ходе симулированных тестов на 2849 недавно заключённых контрактах без известных уязвимостей Sonnet 4.5 и GPT-5 обнаружили по две новые уязвимости нулевого дня. Эти уязвимости потенциально могут привести к потерям в размере 3694 долларов, при этом стоимость использования API GPT-5 достигла 3476 долларов.