DeepSeek V4、Huawei AscendでNVIDIAの性能に匹敵し、遅延の噂を払拭

DeepSeek V4は、Huawei Ascend NPUおよびNVIDIA GPUでの性能が同等であることを示し、適応遅延の噂を払拭しました。V4の技術報告書では、微細な専門家分割スキームが成功裏に実装され、標準的な推論ワークロードで1.50倍から1.73倍の加速を達成し、レイテンシに敏感なシナリオでは最大1.96倍の加速を実現していることが強調されています。チームはまた、DeepGEMMの一部としてMegaMoEカーネルのCUDA版をオープンソース化し、V4が両プラットフォームで理論上ほぼ最大の効率を維持し、性能低下がないことを確認しました。

出典: 原文を表示

免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。