インテルは、インテルのチーフAIエンジニアである沈海浩(Haihao Shen)氏の発表により、Hugging Face上でアリババのWan 2.2ビデオモデルの3つのINT4量子化バージョンをリリースしました。これらのモデルには、T2V-A14B(テキストからビデオへ)、I2V-A14B(画像からビデオへ)、およびTI2V-5B(テキスト・画像ハイブリッドからビデオへ)が含まれており、すべてAutoRoundツールキットを使用して量子化されています。この量子化により、各重みはBF16の2バイトから0.5バイトに削減され、重みのサイズは元の約4分の1に大幅に減少しています。
A14Bモデルはもともと、合計270億パラメータ、ステップごとに140億が活性化されるMoEアーキテクチャを特徴としており、720p解像度でGPUあたり少なくとも80GBのVRAMを必要としていました。TI2V-5Bモデルは密なモデルで、元の形態で4090 GPU上で720pを24fpsで実行できます。インテルはまだ量子化後のVRAM使用量や画質に関するベンチマークデータを提供しておらず、第三者による検証が必要です。これらのモデルはメインラインのvLLM推論パイプラインを使用していないため、ユーザーはインテルの独自のvllm-omniブランチを使用して展開するよう案内されています。
インテル、アリババのWan2.2モデルのINT4量子化バージョンを発表
免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。
