프라임 인텔렉트의 자율 AI 연구 실험이 nanoGPT 속도 챌린지에서 새로운 기록을 세웠습니다. Codex(GPT-5.5 xHigh)와 Claude Code(Opus 4.7 xHigh)를 활용하여, 팀은 약 14,000시간의 H200 컴퓨팅 파워를 사용해 약 10,000회의 실험을 수행했습니다. Opus는 2,930단계 만에 챌린지를 완료하며 이전 인간 기록인 2,990단계를 뛰어넘는 새로운 기록을 달성했습니다. 이 성과에도 불구하고, 실험은 AI 능력의 한계를 드러냈는데, 두 모델 모두 기존에 인간이 개발한 코드나 논문 없이 새로운 알고리즘을 제안하는 데 어려움을 겪었습니다. 모델들은 오픈 소스 기술의 파라미터 스윕에 크게 의존했으며, Codex는 무한 루프에 빠지는 경향이 있었고 Claude는 자주 인간의 개입이 필요했습니다.