NVIDIA a révélé pourquoi Together Compute a choisi l'architecture Blackwell pour alimenter son modèle DeepSeek-V4. Selon NVIDIA, Blackwell est spécialement optimisé pour résoudre des goulets d'étranglement critiques dans l'inférence à long contexte, tels que la pression sur le cache KV pendant la phase de décodage et la bande passante des poids MoE pendant la phase de préremplissage. Bien que l'annonce ait mis en avant les capacités d'un seul système NVIDIA HGX B200, elle n'a pas inclus de métriques de performance spécifiques ni de données comparatives.