구글 딥마인드의 전 연구원인 런 왕은 업계의 주요 병목 현상이 계산 능력, 데이터, 에너지가 아니라 평가 시스템 자체라고 주장하며 AI 커뮤니티 내에서 논쟁을 불러일으켰습니다. 2026년 5월 17일에 발표된 상세한 블로그 게시물에서 왕은 현재의 평가 방법이 AI 모델이 새로운 능력을 개발할 시기를 예측하지 못한다고 주장하며, 출현 능력과 그로킹의 역사적 사례를 증거로 제시했습니다. 왕의 비판은 AI 모델이 단지 이전 모델의 향상된 버전이라는 가정에 초점을 맞추고 있으며, 이는 AI 능력의 중요한 변화를 예측하는 업계의 능력을 저해한다고 주장합니다. 그는 정확한 평가 지표가 없으면 AI 업계가 잘못된 문제를 해결하도록 모델을 훈련시켜 예기치 않은 실패 모드로 이어질 위험이 있다고 경고합니다. 왕의 통찰은 업계의 현재 확장 중심 접근법에 도전하며, 미래 AI 개발을 안내할 보다 견고한 평가 체계의 필요성을 강조합니다.