アリババのQwenチームは、個人用デバイスでのAI処理を強化するために設計された高性能リニアアテンションカーネル「FlashQLA」を発表しました。4月29日にリリースされたFlashQLAは、TileLang上に構築されており、フォワードパスが2〜3倍高速、バックワードパスが2倍高速であると報告されています。このカーネルは、ゲート駆動のカード内計算とハードウェアに優しい代数的最適化を組み込んでいますが、具体的な技術的詳細や制限については公開されていません。
アリババのQwenチームがFlashQLA線形アテンションカーネルを発表
免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。
