LISABench đã khởi động năm 2026 với bài kiểm tra chuẩn an ninh AI lớn đầu tiên, tập trung vào phát hiện lỗ hổng hợp đồng thông minh Web3. Đánh giá quý 1 năm 2026 có sự tham gia của bảy mô hình AI hàng đầu, bao gồm KIMI K2, DeepSeek V3.2 và GPT-5.2, cạnh tranh để xác định các lỗ hổng trong các tình huống thực tế. Ngoài đánh giá kỹ thuật, LISABench còn giới thiệu chương trình thưởng dự đoán bỏ phiếu cộng đồng, cho phép người tham gia dự đoán mô hình hoạt động tốt nhất. Mã nguồn của bài kiểm tra chuẩn hiện đã được mở trên GitHub, giúp các nhà phát triển xem xét và sao chép các bài kiểm tra. Việc bỏ phiếu cho người chiến thắng quý 1 hiện đang mở.