오픈AI의 전 연구원 다니엘 코코타일로는 점점 더 강력해지는 모델에 대해 신뢰할 수 있는 정렬 솔루션을 개발하는 데 AI 산업이 겪고 있는 어려움을 강조했습니다. 발전에도 불구하고, 현재 모델들이 예측 불가능한 행동을 보이며 연구자들이 이를 관리하기 어려워 AI 행동을 제어하는 능력은 여전히 큰 도전 과제로 남아 있습니다. 현재 AI 미래 프로젝트를 이끌고 있는 코코타일로는 시스템이 점점 더 자율적으로 변함에 따라 인간의 지시를 신뢰성 있게 따를 필요성을 강조합니다. 코코타일로는 현대 AI 모델이 전통적인 소프트웨어와 달리 내부 메커니즘의 투명성이 부족해 문제를 진단하고 수정하는 노력을 복잡하게 만든다고 지적합니다. 그는 AI 에이전트가 독립적으로 작동하도록 진화함에 따라 제어 유지의 어려움이 증가할 것이라고 경고합니다. 특히 미국과 중국 기업 간의 경쟁 환경은 기업들이 보안을 위험에 빠뜨리면서 고급 시스템을 조기에 배포하도록 압박할 수 있습니다. 코코타일로는 이러한 정렬 문제를 해결하기 위해 투명성을 높이고 제약을 조기에 설정할 것을 촉구합니다.