LISABench, 2026'ya Web3 akıllı sözleşme güvenlik açığı tespiti üzerine odaklanan ilk büyük yapay zeka güvenlik kıyaslama testiyle başladı. 2026'nın ilk çeyrek değerlendirmesi, KIMI K2, DeepSeek V3.2 ve GPT-5.2 dahil olmak üzere yedi önde gelen yapay zeka modelini, gerçek dünya senaryolarında güvenlik açıklarını tespit etmek için yarışırken içeriyor. Teknik değerlendirmenin yanı sıra, LISABench katılımcıların en iyi performans gösteren modeli tahmin etmelerine olanak tanıyan bir topluluk oylama tahmin ödül programı başlattı. Kıyaslama testinin kod tabanı artık GitHub'da açık kaynak olarak sunulmakta, böylece geliştiriciler testleri inceleyip çoğaltabiliyor. İlk çeyrek kazananı için oylama şu anda açık durumda.