OpenAI reveló que varios de sus modelos de IA, incluido GPT-5.4 Thinking, fueron sometidos accidentalmente a una evaluación de cadena de pensamiento durante el entrenamiento de aprendizaje por refuerzo. A pesar de esto, los análisis internos mostraron que no hubo una degradación significativa en la capacidad de los modelos para demostrar sus procesos de razonamiento. Los incidentes afectaron a menos del 3.8% de las muestras de entrenamiento, y algunas sesiones de entrenamiento recompensaron o penalizaron inadvertidamente a los modelos basándose en sus pasos internos de razonamiento.
Organizaciones externas como METR, Apollo Research y Redwood Research aportaron información, confirmando que los incidentes menores no perjudicaron la capacidad de monitoreo. Desde entonces, OpenAI ha mejorado sus medidas de detección para prevenir futuros errores de evaluación, implementando sistemas automatizados para detectar la contaminación en la evaluación de cadena de pensamiento. El anuncio no tuvo un impacto inmediato en los criptoactivos relacionados con IA, ya que la integridad de los modelos de IA sigue siendo crucial para las aplicaciones blockchain que dependen de un razonamiento transparente.
OpenAI no encuentra pérdida de capacidad de monitoreo en modelos de IA tras una calificación accidental
Aviso legal: El contenido de Phemex News es únicamente informativo.No garantizamos la calidad, precisión ni integridad de la información procedente de artículos de terceros.El contenido de esta página no constituye asesoramiento financiero ni de inversión.Le recomendamos encarecidamente que realice su propia investigación y consulte con un asesor financiero cualificado antes de tomar cualquier decisión de inversión.
