Mô hình AI Anthropic phát hiện lỗ hổng hợp đồng 4,6 triệu USD

Báo cáo mới nhất của Anthropic tiết lộ rằng các mô hình AI của họ, bao gồm Claude Opus 4.5, Claude Sonnet 4.5 và GPT-5, đã phát hiện ra các lỗ hổng trong các hợp đồng thực tế trị giá khoảng 4,6 triệu đô la. Những phát hiện này dựa trên các bài kiểm tra được thực hiện bằng chuẩn đánh giá SCONE-bench, phân tích 405 hợp đồng bị tấn công trong giai đoạn từ 2020 đến 2025. Các mô hình đã thành công trong việc xác định các điểm yếu có thể khai thác trong các hợp đồng bị nhắm mục tiêu sau tháng 3 năm 2025. Ngoài những phát hiện này, các bài kiểm tra mô phỏng trên 2.849 hợp đồng mới triển khai mà không có lỗ hổng đã biết cho thấy Sonnet 4.5 và GPT-5 mỗi mô hình phát hiện hai lỗ hổng zero-day mới. Những lỗ hổng này có thể dẫn đến thiệt hại lên tới 3.694 đô la, với chi phí sử dụng API của GPT-5 lên đến 3.476 đô la.

Bạn cũng có thể thích