Anthropic công bố tỷ lệ chiếm quyền 31,5% của Opus 4.8 AI

Anthropic đã tiết lộ tỷ lệ chiếm quyền điều khiển 31,5% đối với tác nhân trình duyệt AI Claude Opus 4.8 của họ trước khi các biện pháp bảo vệ được áp dụng. Con số này, được trình bày chi tiết trong thẻ hệ thống dài 244 trang của công ty phát hành vào ngày 28 tháng 5, làm nổi bật sự dễ bị tổn thương của mô hình trước các cuộc tấn công chèn lệnh khi không có biện pháp phòng thủ nào được kích hoạt. Việc công bố này nhấn mạnh khoảng cách về tính minh bạch giữa các phòng thí nghiệm AI, khi Anthropic là một trong số ít công ty cung cấp các chỉ số bảo mật chi tiết như vậy. Kiểm tra sau khi áp dụng biện pháp bảo vệ trên một mô hình liên quan, Opus 4.5, cho thấy tỷ lệ thành công của các cuộc tấn công giảm đáng kể xuống khoảng 1%, chứng minh hiệu quả của các lớp phòng thủ của Anthropic. Dữ liệu này đặc biệt có liên quan đến ngành công nghiệp tiền điện tử, nơi các tác nhân AI ngày càng được tích hợp vào các bot giao dịch và nền tảng DeFi. Tỷ lệ chiếm quyền trước khi áp dụng biện pháp bảo vệ là một lời cảnh báo cho các nhà phát triển và nhà đầu tư trong các dự án tiền điện tử liên quan đến AI, nhấn mạnh sự cần thiết của các biện pháp bảo mật mạnh mẽ trong các ứng dụng thực tế.

Bạn cũng có thể thích