A NVIDIA revelou por que a Together Compute optou pela arquitetura Blackwell para alimentar seu modelo DeepSeek-V4. Segundo a NVIDIA, a Blackwell é especificamente otimizada para resolver gargalos críticos na inferência de contexto longo, como a pressão no cache KV durante a fase de decodificação e a largura de banda do peso MoE durante a fase de pré-preenchimento. Embora o anúncio tenha destacado as capacidades de um único sistema NVIDIA HGX B200, não incluiu métricas específicas de desempenho ou dados comparativos.
NVIDIA Detalha o Papel da Arquitetura Blackwell no DeepSeek-V4
Aviso Legal: O conteúdo disponibilizado no Phemex News é apenas para fins informativos. Não garantimos a qualidade, precisão ou integridade das informações provenientes de artigos de terceiros. Este conteúdo não constitui aconselhamento financeiro ou de investimento. Recomendamos fortemente que você realize suas próprias pesquisas e consulte um consultor financeiro qualificado antes de tomar decisões de investimento.
