GPT-5.5 se ha convertido en la primera IA en lograr una puntuación perfecta en el desafío de reescritura binaria ProgramBench, un punto de referencia desarrollado por Meta FAIR, Stanford y Harvard. Este desafío requiere que la IA reconstruya programas a partir de binarios compilados sin código fuente ni pistas. GPT-5.5, en modo de razonamiento alto, recreó con éxito el programa cmatrix tanto en C como en Python, pasando todas las pruebas con costos de $3.17 y $4.84, respectivamente. En contraste, Claude Opus 4.7 falló 19 pruebas a pesar de costos y llamadas API más altos. Este logro destaca el impacto de la intensidad del razonamiento en el rendimiento de la IA, aunque la comprensión completa de binarios sigue siendo un objetivo lejano.