Intel ha lanzado tres versiones cuantificadas en INT4 de los modelos de video Wan 2.2 de Alibaba en Hugging Face, según anunció Haihao Shen, Ingeniero Jefe de IA de Intel. Los modelos incluyen T2V-A14B (texto a video), I2V-A14B (imagen a video) y TI2V-5B (híbrido texto-imagen a video), todos cuantificados usando la herramienta AutoRound. Esta cuantificación reduce cada peso de 2 bytes en BF16 a 0,5 bytes, disminuyendo significativamente el tamaño del peso a aproximadamente una cuarta parte del original.
Los modelos A14B originalmente presentaban una arquitectura MoE con 27 mil millones de parámetros totales y 14 mil millones activados por paso, requiriendo al menos 80GB de VRAM por GPU para resolución 720p. El modelo TI2V-5B, un modelo denso, puede ejecutar 720p a 24fps en una GPU 4090 en su forma original. Intel aún no ha proporcionado datos de referencia sobre el uso de VRAM o la calidad visual tras la cuantificación, dejando necesaria la verificación por terceros. Se dirige a los usuarios a la rama propietaria vllm-omni de Intel para el despliegue, ya que los modelos no usan la línea principal de inferencia vLLM.
Intel lanza versiones cuantificadas INT4 de los modelos Wan2.2 de Alibaba
Aviso legal: El contenido de Phemex News es únicamente informativo.No garantizamos la calidad, precisión ni integridad de la información procedente de artículos de terceros.El contenido de esta página no constituye asesoramiento financiero ni de inversión.Le recomendamos encarecidamente que realice su propia investigación y consulte con un asesor financiero cualificado antes de tomar cualquier decisión de inversión.
