DeepSeek V4 has demonstrated performance parity on Huawei Ascend NPUs and NVIDIA GPUs, dispelling rumors of adaptation delays. The V4 technical report highlights that the Fine-Grained Expert Partitioning Scheme has been successfully implemented, achieving 1.50x to 1.73x acceleration for standard inference workloads and up to 1.96x in latency-sensitive scenarios. The team has also open-sourced the CUDA version of the MegaMoE kernel as part of DeepGEMM, confirming that V4 maintains near-theoretical efficiency across both platforms without performance loss.
DeepSeek V4 Matches NVIDIA Performance on Huawei Ascend, Dispels Delay Rumors
Aviso Legal: O conteúdo disponibilizado no Phemex News é apenas para fins informativos. Não garantimos a qualidade, precisão ou integridade das informações provenientes de artigos de terceiros. Este conteúdo não constitui aconselhamento financeiro ou de investimento. Recomendamos fortemente que você realize suas próprias pesquisas e consulte um consultor financeiro qualificado antes de tomar decisões de investimento.
