PyTorch ekibi, NVIDIA H100 ve B200 GPU'larında LayerNorm ve RMSNorm performansını optimize etti. 8 Nisan'da duyurulan bu iyileştirmeler, otomatik füzyon için torch.compile kullanarak çekirdek seviyesinde neredeyse en son teknoloji performansına ulaşmayı hedefliyor. Bu gelişmenin, bu GPU'ları kullanan kullanıcılar için hesaplama verimliliğini artırması bekleniyor.