NVIDIA ha revelado por qué Together Compute eligió la arquitectura Blackwell para impulsar su modelo DeepSeek-V4. Según NVIDIA, Blackwell está específicamente optimizada para abordar cuellos de botella críticos en la inferencia de contexto largo, como la presión en la caché KV durante la fase de decodificación y el ancho de banda de los pesos MoE durante la fase de prellenado. Aunque el anuncio destacó las capacidades de un solo sistema NVIDIA HGX B200, no incluyó métricas de rendimiento específicas ni datos comparativos.
NVIDIA Detalla el Papel de la Arquitectura Blackwell en DeepSeek-V4
Aviso legal: El contenido de Phemex News es únicamente informativo.No garantizamos la calidad, precisión ni integridad de la información procedente de artículos de terceros.El contenido de esta página no constituye asesoramiento financiero ni de inversión.Le recomendamos encarecidamente que realice su propia investigación y consulte con un asesor financiero cualificado antes de tomar cualquier decisión de inversión.
