Lun Wang, investigador en Google DeepMind, ha criticado los sistemas actuales de evaluación de IA, describiéndolos como un gran cuello de botella en la industria. Wang sostiene que los marcos existentes están desactualizados, ya que solo son capaces de evaluar las capacidades actuales de los modelos sin predecir desarrollos futuros. Advierte que estos sistemas no detectan cuando los modelos aprenden comportamientos nuevos e imprevistos, lo que representa riesgos significativos si los modelos retienen información crítica mientras permanecen factualmente correctos. Wang enfatiza la necesidad de sistemas de evaluación dinámicos que evolucionen junto con los modelos de IA, sugiriendo que la IA debería generar sus propias preguntas de prueba para sondear los límites de otros sistemas.
Investigador de DeepMind Critica los Sistemas de Evaluación de IA como un Obstáculo para la Industria
Aviso legal: El contenido de Phemex News es únicamente informativo.No garantizamos la calidad, precisión ni integridad de la información procedente de artículos de terceros.El contenido de esta página no constituye asesoramiento financiero ni de inversión.Le recomendamos encarecidamente que realice su propia investigación y consulte con un asesor financiero cualificado antes de tomar cualquier decisión de inversión.
