NVIDIA a révélé pourquoi Together Compute a choisi l'architecture Blackwell pour alimenter son modèle DeepSeek-V4. Selon NVIDIA, Blackwell est spécialement optimisé pour résoudre des goulets d'étranglement critiques dans l'inférence à long contexte, tels que la pression sur le cache KV pendant la phase de décodage et la bande passante des poids MoE pendant la phase de préremplissage. Bien que l'annonce ait mis en avant les capacités d'un seul système NVIDIA HGX B200, elle n'a pas inclus de métriques de performance spécifiques ni de données comparatives.
NVIDIA détaille le rôle de l'architecture Blackwell dans DeepSeek-V4
Avertissement : Le contenu proposé sur Phemex News est à titre informatif uniquement. Nous ne garantissons pas la qualité, l'exactitude ou l'exhaustivité des informations provenant d'articles tiers. Ce contenu ne constitue pas un conseil financier ou d'investissement. Nous vous recommandons vivement d'effectuer vos propres recherches et de consulter un conseiller financier qualifié avant toute décision d'investissement.
