Команда PyTorch оптимизировала производительность LayerNorm и RMSNorm на графических процессорах NVIDIA H100 и B200. Объявленные 8 апреля, эти улучшения направлены на достижение почти передового уровня производительности на уровне ядра, используя torch.compile для автоматического слияния. Ожидается, что это развитие повысит вычислительную эффективность для пользователей, использующих эти GPU.
PyTorch улучшает LayerNorm и RMSNorm на графических процессорах NVIDIA H100 и B200
Отказ от ответственности: Контент, представленный на сайте Phemex News, предназначен исключительно для информационных целей.Мы не гарантируем качество, точность и полноту информации, полученной из статей третьих лиц.Содержание этой страницы не является финансовым или инвестиционным советом.Мы настоятельно рекомендуем вам провести собственное исследование и проконсультироваться с квалифицированным финансовым консультантом, прежде чем принимать какие-либо инвестиционные решения.
