DeepSeek V4 đã chứng minh hiệu suất tương đương trên các NPU Huawei Ascend và GPU NVIDIA, bác bỏ những tin đồn về việc trì hoãn thích ứng. Báo cáo kỹ thuật V4 nhấn mạnh rằng Kế hoạch Phân vùng Chuyên gia Tinh vi đã được triển khai thành công, đạt được tốc độ tăng từ 1,50x đến 1,73x cho các khối lượng công việc suy luận tiêu chuẩn và lên đến 1,96x trong các tình huống nhạy cảm với độ trễ. Nhóm phát triển cũng đã công khai mã nguồn phiên bản CUDA của kernel MegaMoE như một phần của DeepGEMM, xác nhận rằng V4 duy trì hiệu quả gần như lý thuyết trên cả hai nền tảng mà không mất hiệu suất.