Автономный эксперимент по исследованию ИИ компании Prime Intellect установил новый рекорд в соревновании по скорости nanoGPT. Используя Codex (GPT-5.5 xHigh) и Claude Code (Opus 4.7 xHigh), команда провела около 10 000 экспериментов, затратив 14 000 часов вычислительной мощности H200. Opus установил новый рекорд, завершив испытание за 2 930 шагов, превзойдя предыдущий человеческий рекорд в 2 990 шагов. Несмотря на это достижение, эксперимент выявил ограничения возможностей ИИ, поскольку обе модели испытывали трудности с предложением новых алгоритмов без существующего кода или научных работ, разработанных людьми. Модели сильно полагались на перебор параметров открытых технологий, при этом Codex был склонен к бесконечным циклам, а Claude часто требовал вмешательства человека.