알리바바, Qwen3.5-Omni 전 모달 대형 모델 출시

알리바바의 첸원(Qianwen)은 최신 풀모달 대규모 모델인 Qwen3.5-Omni를 공개했습니다. 이 첨단 모델 시리즈는 Plus, Flash, Light 크기의 Instruct 버전을 포함하며, 256k 길이의 컨텍스트 기능을 갖추고 있습니다. 10시간 이상의 오디오 입력과 720P(1FPS) 오디오/비디오 입력을 400초 이상 지원합니다. 방대한 텍스트, 시각 자료, 1억 시간 이상의 오디오/비디오 데이터를 사전 학습하여 Qwen3.5-Omni는 풀모달 인식 및 생성에서 뛰어난 성능을 발휘합니다. Qwen3.5-Omni 모델은 이전 모델인 Qwen3-Omni에 비해 다국어 기능이 크게 향상되었습니다. 현재 113개 언어 및 방언에 대한 음성 인식과 36개 언어 및 방언에 대한 음성 생성을 지원하여 알리바바의 AI 기술 제공에 있어 상당한 진전을 이루었습니다.

출처: 원본 보기

면책 조항: Phemex 뉴스에서 제공하는 콘텐츠는 정보 제공 목적으로만 제공됩니다. 제3자 기사에서 출처를 얻은 정보의 품질, 정확성 또는 완전성을 보장하지 않습니다.이 페이지의 콘텐츠는 재무 또는 투자 조언이 아닙니다.투자 결정을 내리기 전에 반드시 스스로 조사하고 자격을 갖춘 재무 전문가와 상담하시기 바랍니다.