Claude Mythos Vorschau: KI-Cybersicherheits-Simulation

Das UK AI Safety Institute (AISI) hat bekannt gegeben, dass Claude Mythos Preview eine Erfolgsquote von 73 % bei Capture The Flag (CTF)-Cybersecurity-Aufgaben auf Expertenniveau erreicht hat, eine Leistung, die kein KI-Modell vor April 2025 erzielt hatte. Darüber hinaus wurde Mythos Preview die erste KI, die "The Last Ones" (TLO), ein simuliertes Unternehmensnetzwerk-Angriffszenario mit 32 Schritten, in 3 von 10 Tests vollständig abschloss. Im Durchschnitt absolvierte es bei allen Versuchen 22 Schritte und übertraf damit Claude Opus 4.6, das im Durchschnitt 16 Schritte erreichte. AISI führte diese Tests unter kontrollierten Bedingungen durch und betonte, dass die Umgebung keine aktiven Verteidiger und keine Verteidigungswerkzeuge enthielt und Sicherheitswarnungen nicht bestraft wurden. Dieses Setup unterscheidet sich von realen Netzwerken, weshalb die Fähigkeit von Mythos Preview, gut geschützte Systeme zu durchdringen, weiterhin unbestätigt bleibt. AISI hob die Notwendigkeit verbesserter Sicherheitsbewertungsmethoden hervor und plant zukünftige Tests in Umgebungen mit aktiver Verteidigung und Echtzeitreaktion.