알리바바의 첸원(Qianwen)은 최신 풀모달 대규모 모델인 Qwen3.5-Omni를 공개했습니다. 이 첨단 모델 시리즈는 Plus, Flash, Light 크기의 Instruct 버전을 포함하며, 256k 길이의 컨텍스트 기능을 갖추고 있습니다. 10시간 이상의 오디오 입력과 720P(1FPS) 오디오/비디오 입력을 400초 이상 지원합니다. 방대한 텍스트, 시각 자료, 1억 시간 이상의 오디오/비디오 데이터를 사전 학습하여 Qwen3.5-Omni는 풀모달 인식 및 생성에서 뛰어난 성능을 발휘합니다. Qwen3.5-Omni 모델은 이전 모델인 Qwen3-Omni에 비해 다국어 기능이 크게 향상되었습니다. 현재 113개 언어 및 방언에 대한 음성 인식과 36개 언어 및 방언에 대한 음성 생성을 지원하여 알리바바의 AI 기술 제공에 있어 상당한 진전을 이루었습니다.