DeepSeek V4 продемонстрировал равную производительность на нейропроцессорах Huawei Ascend и графических процессорах NVIDIA, опровергая слухи о задержках с адаптацией. В техническом отчёте по версии V4 отмечается успешная реализация схемы тонконастройного разбиения экспертов, обеспечившая ускорение от 1,50 до 1,73 раза для стандартных задач инференса и до 1,96 раза в сценариях, чувствительных к задержкам. Команда также опубликовала исходный код CUDA-версии ядра MegaMoE в рамках DeepGEMM, подтвердив, что V4 сохраняет близкую к теоретической эффективность на обеих платформах без потери производительности.
DeepSeek V4 сопоставим с производительностью NVIDIA на Huawei Ascend, опровергает слухи о задержках
Отказ от ответственности: Контент, представленный на сайте Phemex News, предназначен исключительно для информационных целей.Мы не гарантируем качество, точность и полноту информации, полученной из статей третьих лиц.Содержание этой страницы не является финансовым или инвестиционным советом.Мы настоятельно рекомендуем вам провести собственное исследование и проконсультироваться с квалифицированным финансовым консультантом, прежде чем принимать какие-либо инвестиционные решения.
