NVIDIA는 추론 효율성을 크게 향상시킨 오픈 소스 멀티모달 모델인 Nemotron 3 Nano Omni를 출시했습니다. 30B-A3B Mixture of Experts 아키텍처를 기반으로 구축된 이 모델은 256K 컨텍스트 길이를 지원하며 비디오, 오디오, 이미지 및 텍스트 입력을 균일하게 처리합니다. 유사한 모델에 비해 최대 9배 높은 처리량을 달성하여 추론 비용을 절감하고 확장성을 개선합니다. Nemotron 3 Nano Omni는 현재 Hugging Face, OpenRouter, NVIDIA NIM과 같은 플랫폼에서 이용할 수 있습니다. Aible, Applied Scientific Intelligence, H Company와 같은 기업들이 이미 이 모델을 채택하여 산업에 미칠 잠재적 영향을 강조하고 있습니다.