NVIDIA, 추론 효율성을 9배 향상시킨 Nemotron 3 Nano Omni 공개

NVIDIA는 추론 효율성을 크게 향상시킨 오픈 소스 멀티모달 모델인 Nemotron 3 Nano Omni를 출시했습니다. 30B-A3B Mixture of Experts 아키텍처를 기반으로 구축된 이 모델은 256K 컨텍스트 길이를 지원하며 비디오, 오디오, 이미지 및 텍스트 입력을 균일하게 처리합니다. 유사한 모델에 비해 최대 9배 높은 처리량을 달성하여 추론 비용을 절감하고 확장성을 개선합니다. Nemotron 3 Nano Omni는 현재 Hugging Face, OpenRouter, NVIDIA NIM과 같은 플랫폼에서 이용할 수 있습니다. Aible, Applied Scientific Intelligence, H Company와 같은 기업들이 이미 이 모델을 채택하여 산업에 미칠 잠재적 영향을 강조하고 있습니다.

출처: 원본 보기

면책 조항: Phemex 뉴스에서 제공하는 콘텐츠는 정보 제공 목적으로만 제공됩니다. 제3자 기사에서 출처를 얻은 정보의 품질, 정확성 또는 완전성을 보장하지 않습니다.이 페이지의 콘텐츠는 재무 또는 투자 조언이 아닙니다.투자 결정을 내리기 전에 반드시 스스로 조사하고 자격을 갖춘 재무 전문가와 상담하시기 바랍니다.