NVIDIA는 Cosmos 3 세계 모델을 출시하며 두 가지 버전인 Super와 Nano를 다운로드할 수 있도록 제공했습니다. 646억 개의 파라미터를 가진 Super 버전은 훈련 후 로봇 공학 및 자율 주행과 같이 높은 물리적 정확성이 요구되는 응용 프로그램을 위해 설계되었습니다. 157억 개의 파라미터를 특징으로 하는 Nano 버전은 고품질 비디오 및 행동 추론과 같은 저지연 시나리오에 최적화되어 있습니다. 두 버전 모두 Hugging Face와 build.nvidia.com에서 접근 가능하며 NVIDIA NIM 마이크로서비스로 배포를 지원합니다. Cosmos 3는 물리적 AI를 위한 다중 모달 기초 세계 모델로, 텍스트, 이미지, 비디오, 환경 소리 및 행동을 이해하고 생성하기 위해 Mixture of Transformers 아키텍처를 활용합니다. NVIDIA는 이를 최초의 완전 개방형 다중 모달 모델로 설명하며, 개발자가 다운로드, 미세 조정 및 독점 모델로 변환할 수 있도록 허용합니다. 실시간 추론을 위한 Edge 버전도 곧 출시될 예정입니다.