DeepMind元社員：AIの真の課題は評価で計算ではない

グーグル・ディープマインドの元研究者であるルン・ワンは、業界の主要なボトルネックは計算能力、データ、エネルギーではなく、評価システム自体であると主張し、AIコミュニティで議論を巻き起こしています。2026年5月17日に公開された詳細なブログ投稿で、ワンは現在の評価方法がAIモデルが新たな能力を獲得する時期を予測できていないと論じ、歴史的な新興能力や「グロッキング」の例を証拠として挙げています。ワンの批判は、AIモデルが単に前任者の強化版に過ぎないという前提に焦点を当てており、これがAI能力の大きな変化を予見する業界の能力を損なっていると主張しています。彼は、正確な評価指標がなければ、AI業界は誤った問題を解決するためにモデルを訓練してしまい、予期せぬ失敗モードを引き起こす可能性があると警告しています。ワンの洞察は、業界の現在のスケーリング重視の姿勢に異議を唱え、将来のAI開発を導くためのより堅牢な評価フレームワークの必要性を強調しています。