PyTorch verbessert LayerNorm und RMSNorm auf NVIDIA H100- und B200-GPUs

Das PyTorch-Team hat die Leistung von LayerNorm und RMSNorm auf NVIDIA H100- und B200-GPUs optimiert. Am 8. April angekündigt, zielen diese Verbesserungen darauf ab, eine nahezu erstklassige Leistung auf Kernel-Ebene zu erreichen, indem torch.compile für automatische Fusion genutzt wird. Diese Entwicklung soll die Recheneffizienz für Nutzer, die diese GPUs verwenden, verbessern.

Quelle: Original anzeigen

Haftungsausschluss: Die auf Phemex News bereitgestellten Inhalte dienen nur zu Informationszwecken.Wir garantieren nicht die Qualität, Genauigkeit oder Vollständigkeit der Informationen aus Drittquellen.Die Inhalte auf dieser Seite stellen keine Finanz- oder Anlageberatung dar.Wir empfehlen dringend, eigene Recherchen durchzuführen und einen qualifizierten Finanzberater zu konsultieren, bevor Sie Anlageentscheidungen treffen.

Das könnte Ihnen auch gefallen