ByteDance Researchは、画像および動画処理向けに設計された30億パラメータのマルチモーダルモデル「Lance」をオープンソース化しました。128台のA100 GPUでトレーニングされたLanceは、単一のフレームワーク内で理解、生成、編集を同時にサポートします。他のモデルがパラメータサイズを拡大するのとは異なり、LanceはデュアルストリームのMixture-of-Expertsアーキテクチャとモーダル対応の回転位置エンコーディングを採用し、計算効率を管理し信号干渉を低減しています。
軽量設計でありながら、Lanceは画像および動画の生成と編集に関するベンチマークテストで優れた性能を発揮し、生成能力と意味理解のバランスを取るコスト効率の高いアプローチを示しています。この開発は、ByteDanceのマルチモーダルAIにおける革新的な戦略を強調しており、高性能を維持しつつ低計算リソースでのソリューションを提供しています。
ByteDance、30億パラメータのマルチモーダルモデル「Lance」をオープンソース化
免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。
