NVIDIA раскрыла, почему компания Together Compute выбрала архитектуру Blackwell для работы своей модели DeepSeek-V4. По словам NVIDIA, Blackwell специально оптимизирована для устранения критических узких мест при выводе с длинным контекстом, таких как нагрузка на KV-кэш во время фазы декодирования и пропускная способность весов MoE во время фазы предварительной загрузки. В то время как в объявлении были подчеркнуты возможности одной системы NVIDIA HGX B200, конкретные показатели производительности или сравнительные данные не были представлены.
NVIDIA раскрывает роль архитектуры Blackwell в DeepSeek-V4
Отказ от ответственности: Контент, представленный на сайте Phemex News, предназначен исключительно для информационных целей.Мы не гарантируем качество, точность и полноту информации, полученной из статей третьих лиц.Содержание этой страницы не является финансовым или инвестиционным советом.Мы настоятельно рекомендуем вам провести собственное исследование и проконсультироваться с квалифицированным финансовым консультантом, прежде чем принимать какие-либо инвестиционные решения.
