Claude Mythos Dẫn Đầu Mô Phỏng An Ninh Mạng AI

Viện An toàn AI Vương quốc Anh (AISI) đã công bố rằng Claude Mythos Preview đạt tỷ lệ thành công 73% trong các nhiệm vụ an ninh mạng Capture The Flag (CTF) cấp chuyên gia, một thành tích chưa có mô hình AI nào đạt được trước tháng 4 năm 2025. Thêm vào đó, Mythos Preview trở thành AI đầu tiên hoàn thành toàn bộ "The Last Ones" (TLO), một kịch bản tấn công mạng doanh nghiệp mô phỏng gồm 32 bước, trong 3 trên 10 lần thử nghiệm. Trung bình, nó hoàn thành 22 bước trong tất cả các lần thử, vượt trội hơn Claude Opus 4.6 với trung bình 16 bước. AISI tiến hành các bài kiểm tra này trong điều kiện kiểm soát, nhấn mạnh rằng môi trường không có người phòng thủ chủ động và công cụ phòng thủ, cũng như không phạt các cảnh báo an ninh. Cấu hình này khác với mạng thực tế, do đó khả năng xâm nhập các hệ thống được bảo vệ tốt của Mythos Preview vẫn chưa được xác minh. AISI nhấn mạnh sự cần thiết phải nâng cao các phương pháp đánh giá an ninh, lên kế hoạch cho các bài kiểm tra trong tương lai ở môi trường có phòng thủ chủ động và phản ứng thời gian thực.