L'équipe PyTorch a optimisé les performances de LayerNorm et RMSNorm sur les GPU NVIDIA H100 et B200. Annoncées le 8 avril, ces améliorations visent à atteindre des performances proches de l'état de l'art au niveau du noyau, en tirant parti de torch.compile pour une fusion automatique. Ce développement devrait améliorer l'efficacité computationnelle pour les utilisateurs de ces GPU.
PyTorch améliore LayerNorm et RMSNorm sur les GPU NVIDIA H100 et B200
Avertissement : Le contenu proposé sur Phemex News est à titre informatif uniquement. Nous ne garantissons pas la qualité, l'exactitude ou l'exhaustivité des informations provenant d'articles tiers. Ce contenu ne constitue pas un conseil financier ou d'investissement. Nous vous recommandons vivement d'effectuer vos propres recherches et de consulter un conseiller financier qualifié avant toute décision d'investissement.
