PyTorch 팀은 NVIDIA H100 및 B200 GPU에서 LayerNorm과 RMSNorm의 성능을 최적화했습니다. 4월 8일에 발표된 이번 개선 사항은 torch.compile을 활용한 자동 융합을 통해 커널 수준에서 거의 최첨단 성능에 도달하는 것을 목표로 합니다. 이 개발은 해당 GPU를 사용하는 사용자들의 계산 효율성을 향상시킬 것으로 기대됩니다.
PyTorch, NVIDIA H100 및 B200 GPU에서 LayerNorm 및 RMSNorm 성능 향상
면책 조항: Phemex 뉴스에서 제공하는 콘텐츠는 정보 제공 목적으로만 제공됩니다. 제3자 기사에서 출처를 얻은 정보의 품질, 정확성 또는 완전성을 보장하지 않습니다.이 페이지의 콘텐츠는 재무 또는 투자 조언이 아닙니다.투자 결정을 내리기 전에 반드시 스스로 조사하고 자격을 갖춘 재무 전문가와 상담하시기 바랍니다.
