El equipo de PyTorch ha optimizado el rendimiento de LayerNorm y RMSNorm en las GPUs NVIDIA H100 y B200. Anunciadas el 8 de abril, estas mejoras tienen como objetivo alcanzar un rendimiento cercano al estado del arte a nivel de kernel, aprovechando torch.compile para la fusión automática. Se espera que este desarrollo mejore la eficiencia computacional para los usuarios que emplean estas GPUs.