Nvidia s'apprête à stimuler la demande de serveurs IA avec sa nouvelle plateforme Vera Rubin, dont le déploiement est prévu pour la seconde moitié de 2026. Cette plateforme, qui succède à l'architecture Blackwell, promet des améliorations significatives, notamment des coûts d'inférence par token réduits par 10 et un besoin en GPU divisé par 4 pour l'entraînement des modèles mixture-of-experts. La performance par watt devrait s'améliorer jusqu'à 50 fois par rapport à Blackwell. La plateforme Rubin est actuellement en production chez TSMC, avec six nouvelles puces prévues pour une production de masse fin 2026. Les principaux fournisseurs de cloud comme AWS, Google Cloud et Microsoft Azure se préparent à intégrer des instances basées sur Rubin, Microsoft planifiant des déploiements étendus. Ce développement pourrait impacter la capacité de TSMC et intensifier la concurrence entre les concepteurs de puces, notamment AMD ainsi que les siliciums personnalisés de Google et Amazon.