NVIDIA a lancé le Nemotron 3 Nano Omni, un modèle multimodal open-source, améliorant considérablement l'efficacité de l'inférence. Construit sur une architecture Mixture of Experts 30B-A3B, le modèle prend en charge une longueur de contexte de 256K et traite de manière uniforme les entrées vidéo, audio, images et texte. Il atteint un débit jusqu'à 9 fois supérieur à celui des modèles similaires, réduisant ainsi les coûts d'inférence et améliorant la scalabilité. Le Nemotron 3 Nano Omni est désormais accessible sur des plateformes telles que Hugging Face, OpenRouter et NVIDIA NIM. Des entreprises comme Aible, Applied Scientific Intelligence et H Company ont déjà adopté ce modèle, soulignant son impact potentiel sur l'industrie.