アリババのQwenチームは、個人用デバイスでのAI処理を強化するために設計された高性能リニアアテンションカーネル「FlashQLA」を発表しました。4月29日にリリースされたFlashQLAは、TileLang上に構築されており、フォワードパスが2〜3倍高速、バックワードパスが2倍高速であると報告されています。このカーネルは、ゲート駆動のカード内計算とハードウェアに優しい代数的最適化を組み込んでいますが、具体的な技術的詳細や制限については公開されていません。