NVIDIA、推論効率を9倍に向上させるNemotron 3 Nano Omniを発表

NVIDIAは、推論効率を大幅に向上させるオープンソースのマルチモーダルモデル「Nemotron 3 Nano Omni」を発表しました。30B-A3BのMixture of Expertsアーキテクチャを基盤とし、256Kのコンテキスト長をサポート、動画、音声、画像、テキスト入力を一様に処理します。同様のモデルと比較して最大9倍のスループットを実現し、推論コストの削減とスケーラビリティの向上を達成しています。 Nemotron 3 Nano Omniは現在、Hugging Face、OpenRouter、NVIDIA NIMなどのプラットフォームで利用可能です。Aible、Applied Scientific Intelligence、H Companyなどの企業がすでにこのモデルを採用しており、その業界への影響力の大きさを示しています。

出典: 原文を表示

免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。