O Qianwen da Alibaba revelou seu mais recente modelo em larga escala multimodal, o Qwen3.5-Omni. Esta avançada série de modelos inclui versões Instruct nos tamanhos Plus, Flash e Light, apresentando uma capacidade de contexto longo de 256k. Suporta mais de 10 horas de entrada de áudio e mais de 400 segundos de entrada de áudio/vídeo em 720P (1FPS). Pré-treinado com extensos dados textuais, visuais e mais de 100 milhões de horas de dados de áudio/vídeo, o Qwen3.5-Omni se destaca na percepção e geração multimodal.
O modelo Qwen3.5-Omni melhora significativamente seu antecessor, o Qwen3-Omni, ao aprimorar as capacidades multilíngues. Agora suporta reconhecimento de fala para 113 idiomas e dialetos, e geração de fala para 36 idiomas e dialetos, marcando um avanço substancial nas ofertas de tecnologia de IA da Alibaba.
Alibaba Lança o Modelo Grande Multimodal Qwen3.5-Omni
Aviso Legal: O conteúdo disponibilizado no Phemex News é apenas para fins informativos. Não garantimos a qualidade, precisão ou integridade das informações provenientes de artigos de terceiros. Este conteúdo não constitui aconselhamento financeiro ou de investimento. Recomendamos fortemente que você realize suas próprias pesquisas e consulte um consultor financeiro qualificado antes de tomar decisões de investimento.
