GPT-5.5 logra puntuación perfecta en el desafío ProgramBench

GPT-5.5 se ha convertido en la primera IA en lograr una puntuación perfecta en el desafío de reescritura binaria ProgramBench, un punto de referencia desarrollado por Meta FAIR, Stanford y Harvard. Este desafío requiere que la IA reconstruya programas a partir de binarios compilados sin código fuente ni pistas. GPT-5.5, en modo de razonamiento alto, recreó con éxito el programa cmatrix tanto en C como en Python, pasando todas las pruebas con costos de $3.17 y $4.84, respectivamente. En contraste, Claude Opus 4.7 falló 19 pruebas a pesar de costos y llamadas API más altos. Este logro destaca el impacto de la intensidad del razonamiento en el rendimiento de la IA, aunque la comprensión completa de binarios sigue siendo un objetivo lejano.

Fuente: Mostrar original

Aviso legal: El contenido de Phemex News es únicamente informativo.No garantizamos la calidad, precisión ni integridad de la información procedente de artículos de terceros.El contenido de esta página no constituye asesoramiento financiero ni de inversión.Le recomendamos encarecidamente que realice su propia investigación y consulte con un asesor financiero cualificado antes de tomar cualquier decisión de inversión.

También te podría gustar