Luo Fuli de Xiaomi destaca el cambio hacia la era post-entrenamiento en grandes modelos

Luo Fuli, jefe del equipo de grandes modelos de Xiaomi, anunció un cambio significativo en el panorama de los grandes modelos, pasando de la era del Chat a la era del Agente, enfatizando el post-entrenamiento. Esta transición ha modificado las estrategias de asignación de cómputo, con la proporción de cómputo entre pre-entrenamiento y post-entrenamiento alcanzando ahora 1:1 entre los equipos líderes. Anteriormente, la proporción era de 3:5:1 durante la era del Chat. Luo señaló que el enfoque ahora está en escalar el aprendizaje por refuerzo para los Agentes, lo que requiere cambios en la arquitectura del sistema para soportar flujos de trabajo complejos y la programación de clústeres heterogéneos.

Fuente: Mostrar original

Aviso legal: El contenido de Phemex News es únicamente informativo.No garantizamos la calidad, precisión ni integridad de la información procedente de artículos de terceros.El contenido de esta página no constituye asesoramiento financiero ni de inversión.Le recomendamos encarecidamente que realice su propia investigación y consulte con un asesor financiero cualificado antes de tomar cualquier decisión de inversión.

También te podría gustar