NVIDIAは、推論効率を大幅に向上させるオープンソースのマルチモーダルモデル「Nemotron 3 Nano Omni」を発表しました。30B-A3BのMixture of Expertsアーキテクチャを基盤とし、256Kのコンテキスト長をサポート、動画、音声、画像、テキスト入力を一様に処理します。同様のモデルと比較して最大9倍のスループットを実現し、推論コストの削減とスケーラビリティの向上を達成しています。 Nemotron 3 Nano Omniは現在、Hugging Face、OpenRouter、NVIDIA NIMなどのプラットフォームで利用可能です。Aible、Applied Scientific Intelligence、H Companyなどの企業がすでにこのモデルを採用しており、その業界への影響力の大きさを示しています。