DeepSeekは、オープンソースモデルのV4シリーズのプレビュー版をリリースしました。これはMITライセンスの下で、Hugging FaceやModelScopeなどのプラットフォームで利用可能です。V4シリーズには2つのMoEモデルがあり、V4-Proは約1.6兆のパラメータを持ち、1トークンあたり490億が活性化されます。一方、V4-Flashは2840億のパラメータを持ち、1トークンあたり130億が活性化されます。両モデルとも最大100万トークンのコンテキスト長をサポートしています。新モデルは、前バージョンのV3.2と比べて、長文推論におけるメモリ使用量と計算負荷の削減を約束しています。