Google DeepMind'de eski araştırmacı olan Lun Wang, yapay zeka topluluğunda endüstrinin temel darboğazının hesaplama gücü, veri veya enerji değil, değerlendirme sistemi olduğunu iddia ederek tartışma başlattı. 17 Mayıs 2026'da yayımlanan ayrıntılı bir blog yazısında Wang, mevcut değerlendirme yöntemlerinin yapay zeka modellerinin ne zaman yeni yetenekler geliştireceğini öngöremediğini savunuyor ve ortaya çıkan yetenekler ile "grokking" gibi tarihsel örnekleri kanıt olarak gösteriyor. Wang'ın eleştirisi, yapay zeka modellerinin sadece seleflerinin geliştirilmiş versiyonları olduğu varsayımına dayanıyor; bu varsayımın, endüstrinin yapay zeka yeteneklerindeki önemli değişimleri önceden görme yeteneğini zayıflattığını iddia ediyor. Wang, doğru değerlendirme metrikleri olmadan yapay zeka endüstrisinin yanlış problemleri çözmek üzere modeller eğitme riski taşıdığını ve bunun öngörülemeyen başarısızlık modlarına yol açabileceğini uyarıyor. Wang'ın görüşleri, endüstrinin mevcut ölçeklendirme odaklanmasını sorguluyor ve gelecekteki yapay zeka gelişimini yönlendirmek için daha sağlam bir değerlendirme çerçevesine ihtiyaç olduğunu vurguluyor.