GPT-5.5 Alcança Pontuação Perfeita no Desafio ProgramBench

GPT-5.5 tornou-se a primeira IA a alcançar uma pontuação perfeita no desafio de reescrita binária ProgramBench, um benchmark desenvolvido pela Meta FAIR, Stanford e Harvard. Este desafio exige que a IA reconstrua programas a partir de binários compilados sem código-fonte ou pistas. O GPT-5.5, em modo de raciocínio avançado, recriou com sucesso o programa cmatrix tanto em C quanto em Python, passando em todos os testes com custos de $3,17 e $4,84, respectivamente. Em contraste, o Claude Opus 4.7 falhou em 19 testes, apesar de custos e chamadas de API mais elevados. Essa conquista destaca o impacto da intensidade do raciocínio no desempenho da IA, embora a compreensão completa de binários ainda seja um objetivo distante.

Fonte: Mostrar original

Aviso Legal: O conteúdo disponibilizado no Phemex News é apenas para fins informativos. Não garantimos a qualidade, precisão ou integridade das informações provenientes de artigos de terceiros. Este conteúdo não constitui aconselhamento financeiro ou de investimento. Recomendamos fortemente que você realize suas próprias pesquisas e consulte um consultor financeiro qualificado antes de tomar decisões de investimento.

Você também pode gostar