NVIDIA dévoile Nemotron 3 Nano Omni, améliorant l'efficacité de l'inférence par 9 fois

NVIDIA a lancé le Nemotron 3 Nano Omni, un modèle multimodal open-source, améliorant considérablement l'efficacité de l'inférence. Construit sur une architecture Mixture of Experts 30B-A3B, le modèle prend en charge une longueur de contexte de 256K et traite de manière uniforme les entrées vidéo, audio, images et texte. Il atteint un débit jusqu'à 9 fois supérieur à celui des modèles similaires, réduisant ainsi les coûts d'inférence et améliorant la scalabilité. Le Nemotron 3 Nano Omni est désormais accessible sur des plateformes telles que Hugging Face, OpenRouter et NVIDIA NIM. Des entreprises comme Aible, Applied Scientific Intelligence et H Company ont déjà adopté ce modèle, soulignant son impact potentiel sur l'industrie.

Source: Afficher l'original

Avertissement : Le contenu proposé sur Phemex News est à titre informatif uniquement. Nous ne garantissons pas la qualité, l'exactitude ou l'exhaustivité des informations provenant d'articles tiers. Ce contenu ne constitue pas un conseil financier ou d'investissement. Nous vous recommandons vivement d'effectuer vos propres recherches et de consulter un conseiller financier qualifié avant toute décision d'investissement.