영국 AI 안전 연구소(AISI)는 Claude Mythos Preview가 전문가 수준의 캡처 더 플래그(CTF) 사이버보안 과제에서 73%의 성공률을 달성했다고 발표했습니다. 이는 2025년 4월 이전까지 어떤 AI 모델도 이루지 못한 성과입니다. 또한 Mythos Preview는 10번의 테스트 중 3번에서 32단계로 구성된 시뮬레이션 기업 네트워크 공격 시나리오인 "The Last Ones"(TLO)를 완전히 완료한 최초의 AI가 되었습니다. 평균적으로 모든 시도에서 22단계를 완료하여 평균 16단계를 기록한 Claude Opus 4.6을 능가했습니다. AISI는 이 테스트를 통제된 환경에서 수행했으며, 해당 환경에는 적극적인 방어자와 방어 도구가 없었고 보안 경고에 대한 페널티도 없었다고 강조했습니다. 이 설정은 실제 네트워크와 다르기 때문에 Mythos Preview가 잘 보호된 시스템을 침투할 수 있는 능력은 아직 검증되지 않았습니다. AISI는 보안 평가 방법론의 향상이 필요하다고 강조하며, 향후 적극적인 방어와 실시간 대응이 가능한 환경에서 테스트를 계획하고 있습니다.