O Qianwen da Alibaba revelou seu mais recente modelo em larga escala multimodal, o Qwen3.5-Omni. Esta avançada série de modelos inclui versões Instruct nos tamanhos Plus, Flash e Light, apresentando uma capacidade de contexto longo de 256k. Suporta mais de 10 horas de entrada de áudio e mais de 400 segundos de entrada de áudio/vídeo em 720P (1FPS). Pré-treinado com extensos dados textuais, visuais e mais de 100 milhões de horas de dados de áudio/vídeo, o Qwen3.5-Omni se destaca na percepção e geração multimodal. O modelo Qwen3.5-Omni melhora significativamente seu antecessor, o Qwen3-Omni, ao aprimorar as capacidades multilíngues. Agora suporta reconhecimento de fala para 113 idiomas e dialetos, e geração de fala para 36 idiomas e dialetos, marcando um avanço substancial nas ofertas de tecnologia de IA da Alibaba.