DeepSeekは、オープンソースモデルのV4シリーズのプレビュー版をリリースしました。これはMITライセンスの下で、Hugging FaceやModelScopeなどのプラットフォームで利用可能です。V4シリーズには2つのMoEモデルがあり、V4-Proは約1.6兆のパラメータを持ち、1トークンあたり490億が活性化されます。一方、V4-Flashは2840億のパラメータを持ち、1トークンあたり130億が活性化されます。両モデルとも最大100万トークンのコンテキスト長をサポートしています。新モデルは、前バージョンのV3.2と比べて、長文推論におけるメモリ使用量と計算負荷の削減を約束しています。
DeepSeek、1.6兆パラメータを持つV4オープンソースモデルを発表
免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。
