L'expérience de recherche autonome en IA de Prime Intellect a établi un nouveau record dans le défi de vitesse nanoGPT. En utilisant Codex (GPT-5.5 xHigh) et Claude Code (Opus 4.7 xHigh), l'équipe a mené environ 10 000 expériences sur 14 000 heures de puissance de calcul H200. Opus a établi un nouveau record en complétant le défi en 2 930 étapes, dépassant le précédent record humain de 2 990 étapes. Malgré cette réussite, l'expérience a mis en lumière les limites des capacités de l'IA, car les deux modèles ont eu du mal à proposer de nouveaux algorithmes sans code ou articles développés par des humains. Les modèles se sont fortement appuyés sur des balayages de paramètres de technologies open source, Codex étant sujet à des boucles infinies et Claude nécessitant fréquemment une intervention humaine.