小米の羅福利、大規模モデルにおけるポストトレーニング時代への移行を強調

小米の大規模モデルチームの責任者である羅福利氏は、大規模モデルの状況がチャット時代からエージェント時代へと大きく変化し、事後学習（ポストトレーニング）が重要視されていると発表しました。この移行により、計算資源の配分戦略が変わり、主要チーム間での事前学習から事後学習への計算比率が現在は1:1に達しています。以前はチャット時代において3:5:1の比率でした。羅氏は、現在の焦点はエージェントの強化学習のスケーリングにあり、複雑なワークフローや異種クラスタのスケジューリングをサポートするためにシステムアーキテクチャの変更が必要であると指摘しました。

出典: 原文を表示

免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。

​​こちらもおすすめ​​

こちらもおすすめ