A equipe do PyTorch otimizou o desempenho do LayerNorm e do RMSNorm nas GPUs NVIDIA H100 e B200. Anunciadas em 8 de abril, essas melhorias visam alcançar um desempenho próximo ao estado da arte no nível do kernel, aproveitando o torch.compile para fusão automática. Espera-se que esse desenvolvimento aumente a eficiência computacional para os usuários que utilizam essas GPUs.
PyTorch aprimora LayerNorm e RMSNorm nas GPUs NVIDIA H100 e B200
Aviso Legal: O conteúdo disponibilizado no Phemex News é apenas para fins informativos. Não garantimos a qualidade, precisão ou integridade das informações provenientes de artigos de terceiros. Este conteúdo não constitui aconselhamento financeiro ou de investimento. Recomendamos fortemente que você realize suas próprias pesquisas e consulte um consultor financeiro qualificado antes de tomar decisões de investimento.
