Luo Fuli da Xiaomi destaca a transição para a era pós-treinamento em grandes modelos

Luo Fuli, chefe da equipe de grandes modelos da Xiaomi, anunciou uma mudança significativa no cenário dos grandes modelos, passando da era do Chat para a era do Agente, com ênfase no pós-treinamento. Essa transição alterou as estratégias de alocação de computação, com a proporção de computação entre pré-treinamento e pós-treinamento agora alcançando 1:1 entre as equipes líderes. Anteriormente, a proporção era de 3:5:1 durante a era do Chat. Luo observou que o foco agora está em ampliar o aprendizado por reforço para Agentes, o que exige mudanças na arquitetura do sistema para suportar fluxos de trabalho complexos e o agendamento de clusters heterogêneos.

Fonte: Mostrar original

Aviso Legal: O conteúdo disponibilizado no Phemex News é apenas para fins informativos. Não garantimos a qualidade, precisão ou integridade das informações provenientes de artigos de terceiros. Este conteúdo não constitui aconselhamento financeiro ou de investimento. Recomendamos fortemente que você realize suas próprias pesquisas e consulte um consultor financeiro qualificado antes de tomar decisões de investimento.

Você também pode gostar