NVIDIA ha revelado por qué Together Compute eligió la arquitectura Blackwell para impulsar su modelo DeepSeek-V4. Según NVIDIA, Blackwell está específicamente optimizada para abordar cuellos de botella críticos en la inferencia de contexto largo, como la presión en la caché KV durante la fase de decodificación y el ancho de banda de los pesos MoE durante la fase de prellenado. Aunque el anuncio destacó las capacidades de un solo sistema NVIDIA HGX B200, no incluyó métricas de rendimiento específicas ni datos comparativos.