Предварительный обзор Claude Mythos: ИИ в кибербезопасности

Британский Институт Безопасности ИИ (AISI) объявил, что Claude Mythos Preview достиг 73% успеха в экспертных заданиях по кибербезопасности Capture The Flag (CTF), чего ни одной модели ИИ не удавалось достичь до апреля 2025 года. Кроме того, Mythos Preview стал первым ИИ, полностью завершившим "The Last Ones" (TLO) — симулированный сценарий атаки на корпоративную сеть из 32 шагов, успешно пройдя 3 из 10 тестов. В среднем он выполнил 22 шага за все попытки, превзойдя Claude Opus 4.6, который в среднем проходил 16 шагов. AISI проводил эти тесты в контролируемых условиях, подчеркивая, что в среде отсутствовали активные защитники и защитные инструменты, а также не наказывались срабатывания систем безопасности. Такая настройка отличается от реальных сетей, поэтому способность Mythos Preview проникать в хорошо защищённые системы остаётся неподтверждённой. AISI отметил необходимость улучшения методик оценки безопасности и планирует проводить будущие тесты в условиях активной защиты и оперативного реагирования.