Nvidia wird die Nachfrage nach KI-Servern mit seiner neuen Vera Rubin-Plattform steigern, die in der zweiten Hälfte des Jahres 2026 hochgefahren werden soll. Die Plattform, die auf die Blackwell-Architektur folgt, verspricht erhebliche Verbesserungen, darunter 10-mal niedrigere Inferenz-Token-Kosten und 4-mal weniger GPUs, die für das Training von Mixture-of-Experts-Modellen benötigt werden. Die Leistung pro Watt soll im Vergleich zu Blackwell um bis zu das 50-fache verbessert werden. Die Rubin-Plattform befindet sich derzeit bei TSMC in Produktion, wobei sechs neue Chips für die Massenproduktion Ende 2026 geplant sind. Große Cloud-Anbieter wie AWS, Google Cloud und Microsoft Azure bereiten sich darauf vor, Rubin-basierte Instanzen zu integrieren, wobei Microsoft umfangreiche Einsätze plant. Diese Entwicklung könnte die Kapazität von TSMC beeinflussen und den Wettbewerb unter den Chip-Designern, einschließlich AMD und kundenspezifischem Silizium von Google und Amazon, verschärfen.