6月30日の報告によると、Meituanは新しい1兆パラメータモデル「LongCat-2.0」を発表し、オープンソース化する予定です。このモデルの事前学習データは30兆トークンを超え、中国語、英語、多言語、コードを含んでいます。LongCatチームは、ハードウェアの故障や通信異常など国内の計算リソースによるトレーニングの課題に対し、安定性、精度、効率を向上させることで対応しました。HCCLの例外処理と自動障害回復により、月間故障率を70%削減しました。さらに、決定論的オペレーターとパラメータチェックによりトレーニングの精度を確保し、主要モジュールの精度とReduceロジックの最適化も行いました。
美団、LongCat-2.0兆パラメータモデルを発表
免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。
