Zyphraは、AMDハードウェアエコシステムにおける重要な進歩を示す拡散言語モデル「ZAYA1-8B-Diffusion-Preview」を発表しました。このモデルは、専門家混合(MoE)拡散モデルであり、自己回帰型の大規模言語モデルに由来し、AMDフレームワーク内で初の試みであると主張しています。類似のモデルは他のチームからも発表されていますが、ZAYA1は拡散アーキテクチャを活用してエンジニアリング効率を向上させている点で際立っています。
ZAYA1モデルは、逐次的なトークン生成と物理的な速度制限により制約される従来の自己回帰モデルの限界に対処しています。TiDARアプローチを採用することで、ZAYA1は単一のフォワードパスで16のトークン候補の並列デノイズを可能にし、メモリ帯域幅の制約を計算ボトルネックに変換しています。実際のテストでは、ZAYA1の独自のCCAアテンション機構と標準のロスレスサンプラーを組み合わせることで、トークン受信速度が4.6倍に向上することが示されています。この速度向上は混合ロジットサンプラーを使用すると7.7倍に達し、レイテンシが重要な大規模推論タスクのコストを大幅に削減します。
Zyphra、7.7倍の高速化を実現したAMDベースの拡散言語モデルを発表
免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。
