Alibaba lanza el modelo grande multimodal Qwen3.5-Omni

Qianwen de Alibaba ha presentado su último modelo a gran escala de modalidad completa, Qwen3.5-Omni. Esta avanzada serie de modelos incluye versiones Instruct en tamaños Plus, Flash y Light, con una capacidad de contexto largo de 256k. Soporta más de 10 horas de entrada de audio y más de 400 segundos de entrada de audio/video en 720P (1FPS). Preentrenado con extensos datos de texto, visuales y más de 100 millones de horas de datos de audio/video, Qwen3.5-Omni destaca en la percepción y generación de modalidad completa. El modelo Qwen3.5-Omni mejora significativamente a su predecesor, Qwen3-Omni, al potenciar las capacidades multilingües. Ahora soporta el reconocimiento de voz para 113 idiomas y dialectos, y la generación de voz para 36 idiomas y dialectos, marcando un avance sustancial en las ofertas tecnológicas de IA de Alibaba.

Fuente: Mostrar original

Aviso legal: El contenido de Phemex News es únicamente informativo.No garantizamos la calidad, precisión ni integridad de la información procedente de artículos de terceros.El contenido de esta página no constituye asesoramiento financiero ni de inversión.Le recomendamos encarecidamente que realice su propia investigación y consulte con un asesor financiero cualificado antes de tomar cualquier decisión de inversión.