NVIDIA hat bekannt gegeben, warum Together Compute sich für die Blackwell-Architektur entschieden hat, um sein DeepSeek-V4-Modell anzutreiben. Laut NVIDIA ist Blackwell speziell darauf optimiert, kritische Engpässe bei der Langzeit-Kontext-Inferenz zu adressieren, wie beispielsweise den KV-Cache-Druck während der Dekodierungsphase und die MoE-Gewichtsbandbreite während der Vorfüllphase. Während die Ankündigung die Fähigkeiten eines einzelnen NVIDIA HGX B200-Systems hervorhob, wurden keine spezifischen Leistungskennzahlen oder Vergleichsdaten genannt.