A NVIDIA lançou o Nemotron 3 Nano Omni, um modelo multimodal de código aberto, que melhora significativamente a eficiência da inferência. Construído sobre uma arquitetura Mixture of Experts 30B-A3B, o modelo suporta um comprimento de contexto de 256K e processa uniformemente entradas de vídeo, áudio, imagens e texto. Ele alcança até 9 vezes maior taxa de processamento em comparação com modelos similares, reduzindo os custos de inferência e melhorando a escalabilidade. O Nemotron 3 Nano Omni já está acessível em plataformas como Hugging Face, OpenRouter e NVIDIA NIM. Empresas como Aible, Applied Scientific Intelligence e H Company já adotaram o modelo, destacando seu potencial impacto na indústria.