SonicMoE объявила о значительном достижении в производительности, достигнув пикового пропускного уровня на графических процессорах NVIDIA Blackwell по состоянию на 23 апреля (UTC+8). Производительность модели в прямом и обратном проходах в TFLOPS превышает базовый уровень DeepGEMM на 54% и 35% соответственно. Кроме того, она превосходит официальный пример Triton на 21% по производительности в прямом проходе в TFLOPS. SonicMoE также поддерживает минимальный объем памяти для активаций, сопоставимый с плотными моделями, что является заметным прогрессом в эффективности использования GPU.
SonicMoE достигает рекордной производительности на графических процессорах NVIDIA Blackwell
Отказ от ответственности: Контент, представленный на сайте Phemex News, предназначен исключительно для информационных целей.Мы не гарантируем качество, точность и полноту информации, полученной из статей третьих лиц.Содержание этой страницы не является финансовым или инвестиционным советом.Мы настоятельно рекомендуем вам провести собственное исследование и проконсультироваться с квалифицированным финансовым консультантом, прежде чем принимать какие-либо инвестиционные решения.
