NVIDIA stellt Nemotron 3 Nano Omni vor und steigert die Inferenz-Effizienz um das 9-Fache

NVIDIA hat das Nemotron 3 Nano Omni vorgestellt, ein Open-Source-multimodales Modell, das die Effizienz der Inferenz erheblich verbessert. Das Modell basiert auf einer 30B-A3B Mixture of Experts-Architektur, unterstützt eine Kontextlänge von 256K und verarbeitet Video-, Audio-, Bild- und Texteingaben einheitlich. Es erreicht eine bis zu 9-mal höhere Durchsatzrate im Vergleich zu ähnlichen Modellen, was die Inferenzkosten senkt und die Skalierbarkeit verbessert. Das Nemotron 3 Nano Omni ist jetzt auf Plattformen wie Hugging Face, OpenRouter und NVIDIA NIM verfügbar. Unternehmen wie Aible, Applied Scientific Intelligence und H Company haben das Modell bereits übernommen, was dessen potenziellen Einfluss auf die Branche unterstreicht.

Quelle: Original anzeigen

Haftungsausschluss: Die auf Phemex News bereitgestellten Inhalte dienen nur zu Informationszwecken.Wir garantieren nicht die Qualität, Genauigkeit oder Vollständigkeit der Informationen aus Drittquellen.Die Inhalte auf dieser Seite stellen keine Finanz- oder Anlageberatung dar.Wir empfehlen dringend, eigene Recherchen durchzuführen und einen qualifizierten Finanzberater zu konsultieren, bevor Sie Anlageentscheidungen treffen.