Qianwen de Alibaba ha presentado su último modelo a gran escala de modalidad completa, Qwen3.5-Omni. Esta avanzada serie de modelos incluye versiones Instruct en tamaños Plus, Flash y Light, con una capacidad de contexto largo de 256k. Soporta más de 10 horas de entrada de audio y más de 400 segundos de entrada de audio/video en 720P (1FPS). Preentrenado con extensos datos de texto, visuales y más de 100 millones de horas de datos de audio/video, Qwen3.5-Omni destaca en la percepción y generación de modalidad completa. El modelo Qwen3.5-Omni mejora significativamente a su predecesor, Qwen3-Omni, al potenciar las capacidades multilingües. Ahora soporta el reconocimiento de voz para 113 idiomas y dialectos, y la generación de voz para 36 idiomas y dialectos, marcando un avance sustancial en las ofertas tecnológicas de IA de Alibaba.