DeepSeek V4 hat eine Leistungsparität auf Huawei Ascend NPUs und NVIDIA GPUs demonstriert und damit Gerüchte über Anpassungsverzögerungen widerlegt. Der technische Bericht zu V4 hebt hervor, dass das Fine-Grained Expert Partitioning Scheme erfolgreich implementiert wurde und eine Beschleunigung von 1,50x bis 1,73x bei Standard-Inferenz-Workloads sowie bis zu 1,96x in latenzsensitiven Szenarien erreicht. Das Team hat außerdem die CUDA-Version des MegaMoE-Kernels als Teil von DeepGEMM als Open Source veröffentlicht und bestätigt, dass V4 auf beiden Plattformen eine nahezu theoretische Effizienz ohne Leistungsverlust beibehält.
DeepSeek V4 erreicht NVIDIA-Leistung auf Huawei Ascend und widerlegt Verzögerungsgerüchte
Haftungsausschluss: Die auf Phemex News bereitgestellten Inhalte dienen nur zu Informationszwecken.Wir garantieren nicht die Qualität, Genauigkeit oder Vollständigkeit der Informationen aus Drittquellen.Die Inhalte auf dieser Seite stellen keine Finanz- oder Anlageberatung dar.Wir empfehlen dringend, eigene Recherchen durchzuführen und einen qualifizierten Finanzberater zu konsultieren, bevor Sie Anlageentscheidungen treffen.
