Núcleo NVIDIA Megatron Integra Muon e Otimizadores Avançados

A NVIDIA AI expandiu seu framework Megatron Core para incluir suporte a otimizadores avançados como Muon, juntamente com otimizadores de pesquisa como MOP e REKLS. Esse desenvolvimento visa melhorar a eficiência do treinamento de modelos em grande escala, incluindo aqueles na escala do Kimi K2 e Qwen3 30B. O anúncio destaca a necessidade de técnicas além dos métodos padrão de paralelismo de dados para alcançar um treinamento eficiente dos modelos. No entanto, métricas específicas de desempenho ou detalhes de implementação não foram fornecidos.

Fonte: Mostrar original

Aviso Legal: O conteúdo disponibilizado no Phemex News é apenas para fins informativos. Não garantimos a qualidade, precisão ou integridade das informações provenientes de artigos de terceiros. Este conteúdo não constitui aconselhamento financeiro ou de investimento. Recomendamos fortemente que você realize suas próprias pesquisas e consulte um consultor financeiro qualificado antes de tomar decisões de investimento.

Você também pode gostar