Der neueste Bericht von Anthropic zeigt, dass seine KI-Modelle, darunter Claude Opus 4.5, Claude Sonnet 4.5 und GPT-5, Schwachstellen in realen Verträgen im Wert von etwa 4,6 Millionen US-Dollar identifiziert haben. Diese Erkenntnisse basieren auf Tests, die mit dem SCONE-bench-Benchmark durchgeführt wurden, der 405 Verträge analysierte, die zwischen 2020 und 2025 angegriffen wurden. Die Modelle konnten erfolgreich ausnutzbare Schwachstellen in Verträgen erkennen, die nach März 2025 ins Visier genommen wurden. Zusätzlich zu diesen Ergebnissen zeigten simulierte Tests an 2.849 neu eingesetzten Verträgen ohne bekannte Schwachstellen, dass Sonnet 4.5 und GPT-5 jeweils zwei neue Zero-Day-Schwachstellen entdeckten. Diese Schwachstellen könnten potenziell zu Verlusten in Höhe von 3.694 US-Dollar führen, wobei die Kosten für die Nutzung der GPT-5-API 3.476 US-Dollar erreichen.