El equipo de PyTorch ha optimizado el rendimiento de LayerNorm y RMSNorm en las GPUs NVIDIA H100 y B200. Anunciadas el 8 de abril, estas mejoras tienen como objetivo alcanzar un rendimiento cercano al estado del arte a nivel de kernel, aprovechando torch.compile para la fusión automática. Se espera que este desarrollo mejore la eficiencia computacional para los usuarios que emplean estas GPUs.
PyTorch mejora LayerNorm y RMSNorm en GPUs NVIDIA H100 y B200
Aviso legal: El contenido de Phemex News es únicamente informativo.No garantizamos la calidad, precisión ni integridad de la información procedente de artículos de terceros.El contenido de esta página no constituye asesoramiento financiero ni de inversión.Le recomendamos encarecidamente que realice su propia investigación y consulte con un asesor financiero cualificado antes de tomar cualquier decisión de inversión.
