A NVIDIA revelou por que a Together Compute optou pela arquitetura Blackwell para alimentar seu modelo DeepSeek-V4. Segundo a NVIDIA, a Blackwell é especificamente otimizada para resolver gargalos críticos na inferência de contexto longo, como a pressão no cache KV durante a fase de decodificação e a largura de banda do peso MoE durante a fase de pré-preenchimento. Embora o anúncio tenha destacado as capacidades de um único sistema NVIDIA HGX B200, não incluiu métricas específicas de desempenho ou dados comparativos.