OpenAI garantiza monitoreo de IA tras error de calificación

OpenAI reveló que varios de sus modelos de IA, incluido GPT-5.4 Thinking, fueron sometidos accidentalmente a una evaluación de cadena de pensamiento durante el entrenamiento de aprendizaje por refuerzo. A pesar de esto, los análisis internos mostraron que no hubo una degradación significativa en la capacidad de los modelos para demostrar sus procesos de razonamiento. Los incidentes afectaron a menos del 3.8% de las muestras de entrenamiento, y algunas sesiones de entrenamiento recompensaron o penalizaron inadvertidamente a los modelos basándose en sus pasos internos de razonamiento. Organizaciones externas como METR, Apollo Research y Redwood Research aportaron información, confirmando que los incidentes menores no perjudicaron la capacidad de monitoreo. Desde entonces, OpenAI ha mejorado sus medidas de detección para prevenir futuros errores de evaluación, implementando sistemas automatizados para detectar la contaminación en la evaluación de cadena de pensamiento. El anuncio no tuvo un impacto inmediato en los criptoactivos relacionados con IA, ya que la integridad de los modelos de IA sigue siendo crucial para las aplicaciones blockchain que dependen de un razonamiento transparente.