DeepSeek V4 has demonstrated performance parity on Huawei Ascend NPUs and NVIDIA GPUs, dispelling rumors of adaptation delays. The V4 technical report highlights that the Fine-Grained Expert Partitioning Scheme has been successfully implemented, achieving 1.50x to 1.73x acceleration for standard inference workloads and up to 1.96x in latency-sensitive scenarios. The team has also open-sourced the CUDA version of the MegaMoE kernel as part of DeepGEMM, confirming that V4 maintains near-theoretical efficiency across both platforms without performance loss.
DeepSeek V4 Matches NVIDIA Performance on Huawei Ascend, Dispels Delay Rumors
Tuyên bố miễn trừ trách nhiệm: Nội dung được cung cấp trên Phemex News chỉ nhằm mục đích cung cấp thông tin.Chúng tôi không đảm bảo chất lượng, độ chính xác hoặc tính đầy đủ của thông tin có nguồn từ các bài viết của bên thứ ba.Nội dung trên trang này không cấu thành lời khuyên về tài chính hoặc đầu tư.Chúng tôi đặc biệt khuyến khích bạn tự tiến hành nghiên cứu và tham khảo ý kiến của cố vấn tài chính đủ tiêu chuẩn trước khi đưa ra bất kỳ quyết định đầu tư nào.
