NVIDIA hat das Nemotron 3 Nano Omni vorgestellt, ein Open-Source-multimodales Modell, das die Effizienz der Inferenz erheblich verbessert. Das Modell basiert auf einer 30B-A3B Mixture of Experts-Architektur, unterstützt eine Kontextlänge von 256K und verarbeitet Video-, Audio-, Bild- und Texteingaben einheitlich. Es erreicht eine bis zu 9-mal höhere Durchsatzrate im Vergleich zu ähnlichen Modellen, was die Inferenzkosten senkt und die Skalierbarkeit verbessert. Das Nemotron 3 Nano Omni ist jetzt auf Plattformen wie Hugging Face, OpenRouter und NVIDIA NIM verfügbar. Unternehmen wie Aible, Applied Scientific Intelligence und H Company haben das Modell bereits übernommen, was dessen potenziellen Einfluss auf die Branche unterstreicht.