Thí nghiệm nghiên cứu AI tự động của Prime Intellect đã thiết lập kỷ lục mới trong thử thách tốc độ nanoGPT. Sử dụng Codex (GPT-5.5 xHigh) và Claude Code (Opus 4.7 xHigh), nhóm đã tiến hành khoảng 10.000 thí nghiệm trong hơn 14.000 giờ sử dụng sức mạnh tính toán H200. Opus đã đạt kỷ lục mới khi hoàn thành thử thách trong 2.930 bước, vượt qua kỷ lục trước đó của con người là 2.990 bước. Mặc dù đạt được thành tích này, thí nghiệm cũng làm nổi bật những hạn chế trong khả năng của AI, khi cả hai mô hình đều gặp khó khăn trong việc đề xuất các thuật toán mới mà không có mã hoặc bài báo do con người phát triển trước đó. Các mô hình phụ thuộc nhiều vào việc quét tham số của các công nghệ mã nguồn mở, với Codex dễ bị lặp vô hạn và Claude thường xuyên cần sự can thiệp của con người.