Дэниел Кокотайло, бывший исследователь OpenAI, подчеркнул трудности индустрии искусственного интеллекта в разработке надежных решений по согласованию поведения для все более мощных моделей. Несмотря на достижения, способность контролировать поведение ИИ остается значительной проблемой, поскольку текущие модели демонстрируют непредсказуемые действия, которые исследователям трудно управлять. Кокотайло, ныне возглавляющий проект AI Futures, подчеркивает необходимость создания систем, которые надежно следуют человеческим инструкциям по мере того, как они становятся более автономными. Кокотайло отмечает, что современные модели ИИ, в отличие от традиционного программного обеспечения, не обладают прозрачностью внутренних механизмов, что усложняет диагностику и исправление проблем. Он предупреждает, что по мере того, как агенты ИИ развиваются и начинают работать самостоятельно, сложность поддержания контроля будет расти. Конкурентная среда, особенно между компаниями США и Китая, может заставить фирмы преждевременно внедрять передовые системы, что несет риски для безопасности. Кокотайло выступает за повышение прозрачности и раннее установление ограничений для решения этих проблем согласования.