Metaは、モバイルデバイス向けに最適化されたMixture of Experts(MoE)モデルであるMobileMoEを発表しました。これにより、スマートフォンでのパフォーマンスが大幅に向上しました。MobileMoE-Sは、iPhone 16 ProのGPU/MLXバックエンドで、従来の密なモデルと比較して最大3.8倍高速な入力処理を実現し、メモリ使用量と精度は同等に維持しています。この進歩は、商用スマートフォンでの初の効率的なMoE推論を示しており、増加したDRAM容量を活用しています。
MobileMoEモデルは、デコーダーのみのTransformerアーキテクチャを保持し、密なフィードフォワード層をMoE層に置き換えています。6兆トークンでの事前学習や量子化対応トレーニングを含む4段階のトレーニングプロセスを採用しています。量子化後にわずかな性能低下が見られるものの、MobileMoEは競争力を維持し、特定のベンチマークではOLMoE-1B-7Bなどの他のモデルを上回っています。今後の改善は、指示に従う能力の向上と実際の入力に対するメモリ使用の最適化に焦点を当てる予定です。
MetaのMobileMoEがiPhone 16 Proで3.8倍の高速化を達成
免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。
