GPT-5.5 tornou-se a primeira IA a alcançar uma pontuação perfeita no desafio de reescrita binária ProgramBench, um benchmark desenvolvido pela Meta FAIR, Stanford e Harvard. Este desafio exige que a IA reconstrua programas a partir de binários compilados sem código-fonte ou pistas. O GPT-5.5, em modo de raciocínio avançado, recriou com sucesso o programa cmatrix tanto em C quanto em Python, passando em todos os testes com custos de $3,17 e $4,84, respectivamente. Em contraste, o Claude Opus 4.7 falhou em 19 testes, apesar de custos e chamadas de API mais elevados. Essa conquista destaca o impacto da intensidade do raciocínio no desempenho da IA, embora a compreensão completa de binários ainda seja um objetivo distante.