Luo Fuli, jefe del equipo de grandes modelos de Xiaomi, anunció un cambio significativo en el panorama de los grandes modelos, pasando de la era del Chat a la era del Agente, enfatizando el post-entrenamiento. Esta transición ha modificado las estrategias de asignación de cómputo, con la proporción de cómputo entre pre-entrenamiento y post-entrenamiento alcanzando ahora 1:1 entre los equipos líderes. Anteriormente, la proporción era de 3:5:1 durante la era del Chat. Luo señaló que el enfoque ahora está en escalar el aprendizaje por refuerzo para los Agentes, lo que requiere cambios en la arquitectura del sistema para soportar flujos de trabajo complejos y la programación de clústeres heterogéneos.