Intel, Baş Yapay Zeka Mühendisi Haihao Shen'in duyurusuna göre, Alibaba'nın Wan 2.2 video modellerinin üç INT4 kuantize edilmiş versiyonunu Hugging Face üzerinde yayınladı. Modeller arasında T2V-A14B (metinden videoya), I2V-A14B (görüntüden videoya) ve TI2V-5B (metin-görüntü hibritten videoya) bulunuyor ve hepsi AutoRound araç seti kullanılarak kuantize edildi. Bu kuantizasyon, her ağırlığı BF16'da 2 bayttan 0,5 bayta indirerek ağırlık boyutunu orijinalinin yaklaşık dörtte birine önemli ölçüde düşürüyor. A14B modelleri başlangıçta 27 milyar toplam parametre ve her adımda 14 milyar aktif parametreye sahip bir MoE mimarisi içeriyordu ve 720p çözünürlük için GPU başına en az 80GB VRAM gerektiriyordu. TI2V-5B modeli, yoğun bir model olarak, orijinal haliyle 4090 GPU üzerinde 720p'de 24fps çalışabiliyor. Intel henüz kuantizasyon sonrası VRAM kullanımı veya görsel kalite hakkında kıyaslama verisi sağlamadı, bu nedenle üçüncü taraf doğrulaması gerekli. Kullanıcılar, modellerin ana vLLM çıkarım hattını kullanmaması nedeniyle dağıtım için Intel'in özel vllm-omni dalına yönlendiriliyor.