Luo Fuli, chefe da equipe de grandes modelos da Xiaomi, anunciou uma mudança significativa no cenário dos grandes modelos, passando da era do Chat para a era do Agente, com ênfase no pós-treinamento. Essa transição alterou as estratégias de alocação de computação, com a proporção de computação entre pré-treinamento e pós-treinamento agora alcançando 1:1 entre as equipes líderes. Anteriormente, a proporção era de 3:5:1 durante a era do Chat. Luo observou que o foco agora está em ampliar o aprendizado por reforço para Agentes, o que exige mudanças na arquitetura do sistema para suportar fluxos de trabalho complexos e o agendamento de clusters heterogêneos.