Nghiên cứu mới nhất của Anthropic làm nổi bật khả năng tấn công trên chuỗi đáng kể của các tác nhân AI. Trong các mô phỏng các vụ hack hợp đồng thông minh thực tế từ năm 2020 đến 2025, các mô hình AI Claude Opus 4.5, Sonnet 4.5 và GPT-5 đã cùng nhau tái tạo các lỗ hổng trị giá khoảng 4,6 triệu đô la. Thêm vào đó, trong quá trình quét 2.849 hợp đồng không có lỗ hổng đã biết, các mô hình đã phát hiện hai lỗ hổng zero-day mới và thành công mô phỏng các cuộc khai thác có lợi nhuận. Nghiên cứu cho thấy lợi nhuận từ các cuộc tấn công trên chuỗi do AI điều khiển đã tăng gấp đôi khoảng mỗi 1,3 tháng trong năm qua, chứng minh rằng công nghệ AI hiện nay hoàn toàn có khả năng tự động khai thác các lỗ hổng để kiếm lợi nhuận.