DeepSeek V4 erreicht NVIDIA-Leistung auf Huawei Ascend und widerlegt Verzögerungsgerüchte

DeepSeek V4 hat eine Leistungsparität auf Huawei Ascend NPUs und NVIDIA GPUs demonstriert und damit Gerüchte über Anpassungsverzögerungen widerlegt. Der technische Bericht zu V4 hebt hervor, dass das Fine-Grained Expert Partitioning Scheme erfolgreich implementiert wurde und eine Beschleunigung von 1,50x bis 1,73x bei Standard-Inferenz-Workloads sowie bis zu 1,96x in latenzsensitiven Szenarien erreicht. Das Team hat außerdem die CUDA-Version des MegaMoE-Kernels als Teil von DeepGEMM als Open Source veröffentlicht und bestätigt, dass V4 auf beiden Plattformen eine nahezu theoretische Effizienz ohne Leistungsverlust beibehält.

Quelle: Original anzeigen

Haftungsausschluss: Die auf Phemex News bereitgestellten Inhalte dienen nur zu Informationszwecken.Wir garantieren nicht die Qualität, Genauigkeit oder Vollständigkeit der Informationen aus Drittquellen.Die Inhalte auf dieser Seite stellen keine Finanz- oder Anlageberatung dar.Wir empfehlen dringend, eigene Recherchen durchzuführen und einen qualifizierten Finanzberater zu konsultieren, bevor Sie Anlageentscheidungen treffen.