Eski OpenAI araştırmacısı Daniel Kokotajlo, yapay zeka endüstrisinin giderek daha güçlü modeller için güvenilir hizalama çözümleri geliştirmekte yaşadığı zorlukları vurguladı. İlerlemelere rağmen, yapay zekanın davranışlarını kontrol etme yeteneği önemli bir sorun olmaya devam ediyor; çünkü mevcut modeller, araştırmacıların yönetmekte zorlandığı öngörülemeyen eylemler sergiliyor. Şu anda AI Futures Projesi'ni yöneten Kokotajlo, sistemlerin daha otonom hale geldikçe insan talimatlarını güvenilir şekilde takip etmesi gerektiğinin altını çiziyor. Kokotajlo, modern yapay zeka modellerinin geleneksel yazılımların aksine iç mekanizmalarında şeffaflıktan yoksun olduğunu ve bu durumun sorunları teşhis edip düzeltme çabalarını zorlaştırdığını belirtiyor. Yapay zeka ajanları bağımsız çalışacak şekilde evrildikçe kontrolü sürdürmenin zorluğunun artacağı konusunda uyarıyor. Özellikle ABD ve Çinli firmalar arasındaki rekabet ortamının, şirketleri gelişmiş sistemleri erken kullanıma sunmaya zorlayabileceğini ve bunun güvenlik riskleri doğurabileceğini ifade ediyor. Kokotajlo, bu hizalama sorunlarını ele almak için artan şeffaflık ve erken kısıtlamaların belirlenmesini savunuyor.