NVIDIA Lança Nemotron 3 Nano Omni, Aumentando a Eficiência de Inferência em 9x

A NVIDIA lançou o Nemotron 3 Nano Omni, um modelo multimodal de código aberto, que melhora significativamente a eficiência da inferência. Construído sobre uma arquitetura Mixture of Experts 30B-A3B, o modelo suporta um comprimento de contexto de 256K e processa uniformemente entradas de vídeo, áudio, imagens e texto. Ele alcança até 9 vezes maior taxa de processamento em comparação com modelos similares, reduzindo os custos de inferência e melhorando a escalabilidade. O Nemotron 3 Nano Omni já está acessível em plataformas como Hugging Face, OpenRouter e NVIDIA NIM. Empresas como Aible, Applied Scientific Intelligence e H Company já adotaram o modelo, destacando seu potencial impacto na indústria.

Fonte: Mostrar original

Aviso Legal: O conteúdo disponibilizado no Phemex News é apenas para fins informativos. Não garantimos a qualidade, precisão ou integridade das informações provenientes de artigos de terceiros. Este conteúdo não constitui aconselhamento financeiro ou de investimento. Recomendamos fortemente que você realize suas próprias pesquisas e consulte um consultor financeiro qualificado antes de tomar decisões de investimento.