NVIDIA는 Together Compute가 DeepSeek-V4 모델에 Blackwell 아키텍처를 선택한 이유를 공개했습니다. NVIDIA에 따르면 Blackwell은 디코딩 단계에서의 KV 캐시 압력과 프리필 단계에서의 MoE 가중치 대역폭과 같은 장기 컨텍스트 추론의 중요한 병목 현상을 해결하도록 특별히 최적화되었습니다. 이번 발표에서는 단일 NVIDIA HGX B200 시스템의 성능을 강조했지만, 구체적인 성능 지표나 비교 데이터는 포함하지 않았습니다.