元OpenAI研究者のダニエル・ココタジロは、より強力になるモデルに対して信頼できるアライメント(整合性)ソリューションを開発することにおけるAI業界の苦闘を指摘しています。進歩はあるものの、AIの行動を制御する能力は依然として大きな課題であり、現在のモデルは予測不可能な動作を示し、研究者が管理するのが困難です。現在AIフューチャーズプロジェクトを率いるココタジロは、システムがより自律的になるにつれて、人間の指示に確実に従う必要性を強調しています。 ココタジロは、現代のAIモデルは従来のソフトウェアとは異なり、その内部メカニズムの透明性が欠如しているため、問題の診断や修正が複雑になると指摘しています。AIエージェントが独立して動作するように進化するにつれて、制御を維持する難しさが増すと警告しています。特に米中企業間の競争環境は、企業に高度なシステムを早期に導入させる圧力をかけ、セキュリティリスクを招く可能性があります。ココタジロは、これらのアライメント課題に対処するために、透明性の向上と制約の早期設定を提唱しています。