Daniel Kokotajlo, ex-pesquisador da OpenAI, destacou a dificuldade da indústria de IA em desenvolver soluções confiáveis de alinhamento para modelos cada vez mais poderosos. Apesar dos avanços, a capacidade de controlar o comportamento da IA continua sendo um desafio significativo, já que os modelos atuais apresentam ações imprevisíveis que os pesquisadores acham difíceis de gerenciar. Kokotajlo, agora liderando o Projeto AI Futures, enfatiza a necessidade de sistemas que sigam as instruções humanas de forma confiável à medida que se tornam mais autônomos. Kokotajlo aponta que os modelos modernos de IA, ao contrário do software tradicional, carecem de transparência em seus mecanismos internos, complicando os esforços para diagnosticar e corrigir problemas. Ele alerta que, à medida que os agentes de IA evoluem para operar de forma independente, a dificuldade de manter o controle aumentará. O cenário competitivo, especialmente entre empresas dos EUA e da China, pode pressionar as companhias a lançar sistemas avançados prematuramente, colocando a segurança em risco. Kokotajlo defende maior transparência e o estabelecimento precoce de restrições para enfrentar esses desafios de alinhamento.