NVIDIA a lancé le modèle mondial Cosmos 3, proposant deux versions disponibles en téléchargement : Super et Nano. La version Super, avec 64,6 milliards de paramètres, est conçue pour des applications nécessitant une grande précision physique, telles que la robotique post-formation et la conduite autonome. La version Nano, dotée de 15,7 milliards de paramètres, est optimisée pour des scénarios à faible latence comme la vidéo de haute qualité et le raisonnement d'action. Les deux versions sont accessibles sur Hugging Face et build.nvidia.com, avec un support pour le déploiement en tant que microservices NVIDIA NIM. Cosmos 3 est un modèle mondial fondamental multimodal pour l'IA physique, utilisant une architecture Mixture of Transformers pour comprendre et générer du texte, des images, des vidéos, des sons environnementaux et des actions. NVIDIA le décrit comme le premier modèle multimodal entièrement ouvert, permettant aux développeurs de le télécharger, de l'affiner et de le convertir en modèles propriétaires. Une version Edge pour l'inférence en temps réel est attendue prochainement.