O experimento autônomo de pesquisa em IA da Prime Intellect estabeleceu um novo recorde no desafio de velocidade nanoGPT. Utilizando Codex (GPT-5.5 xHigh) e Claude Code (Opus 4.7 xHigh), a equipe realizou aproximadamente 10.000 experimentos ao longo de 14.000 horas de poder computacional H200. Opus alcançou um novo recorde ao completar o desafio em 2.930 passos, superando o recorde humano anterior de 2.990 passos. Apesar dessa conquista, o experimento destacou limitações nas capacidades da IA, já que ambos os modelos tiveram dificuldades para propor novos algoritmos sem código ou artigos desenvolvidos por humanos. Os modelos dependeram fortemente de varreduras de parâmetros em tecnologias de código aberto, com o Codex propenso a loops infinitos e o Claude frequentemente necessitando de intervenção humana.