L'industrie de l'IA connaît une révolution silencieuse qui pourrait ébranler la domination de NVIDIA sur le marché des GPU. Ce changement est porté par deux avancées technologiques : l'allégement des algorithmes et le matériel dédié à l'inférence. L'architecture Mixture of Experts (MoE) de DeepSeek permet aux modèles d'IA d'activer seulement une fraction de leurs paramètres, réduisant ainsi considérablement les besoins en puissance de calcul. Parallèlement, des entreprises comme Cerebras et Groq développent des puces d'inférence avec mémoire intégrée, éliminant les problèmes de latence inhérents aux GPU traditionnels. Ces innovations pourraient réduire drastiquement les coûts opérationnels de l'IA, avec des dépenses de formation et d'inférence pouvant chuter jusqu'à 90 %. En conséquence, la position de marché de NVIDIA est menacée, notamment dans le secteur de l'inférence, où elle fait face à la concurrence de fabricants de puces spécialisés. L'acquisition récente de Groq pour 20 milliards de dollars par l'entreprise souligne ses efforts pour s'adapter à ce paysage en mutation. Les implications de ce changement de paradigme pourraient avoir un impact significatif sur la valorisation de NVIDIA et sur le marché plus large du matériel d'IA.