Nhóm PyTorch đã tối ưu hóa hiệu suất của LayerNorm và RMSNorm trên các GPU NVIDIA H100 và B200. Được công bố vào ngày 8 tháng 4, những cải tiến này nhằm đạt được hiệu suất gần như tiên tiến nhất ở cấp độ kernel, tận dụng torch.compile để tự động hợp nhất. Phát triển này dự kiến sẽ nâng cao hiệu quả tính toán cho người dùng sử dụng các GPU này.
PyTorch Cải Thiện LayerNorm và RMSNorm trên GPU NVIDIA H100 và B200
Tuyên bố miễn trừ trách nhiệm: Nội dung được cung cấp trên Phemex News chỉ nhằm mục đích cung cấp thông tin.Chúng tôi không đảm bảo chất lượng, độ chính xác hoặc tính đầy đủ của thông tin có nguồn từ các bài viết của bên thứ ba.Nội dung trên trang này không cấu thành lời khuyên về tài chính hoặc đầu tư.Chúng tôi đặc biệt khuyến khích bạn tự tiến hành nghiên cứu và tham khảo ý kiến của cố vấn tài chính đủ tiêu chuẩn trước khi đưa ra bất kỳ quyết định đầu tư nào.
