DeepSeek đã ra mắt phiên bản xem trước của dòng mô hình mã nguồn mở V4, hiện có sẵn dưới giấy phép MIT trên các nền tảng như Hugging Face và ModelScope. Dòng V4 bao gồm hai mô hình MoE: V4-Pro, với khoảng 1,6 nghìn tỷ tham số và 49 tỷ tham số được kích hoạt trên mỗi token, và V4-Flash, với 284 tỷ tham số và 13 tỷ tham số được kích hoạt trên mỗi token. Cả hai mô hình đều hỗ trợ độ dài ngữ cảnh lên đến 1 triệu token. Các mô hình mới hứa hẹn giảm sử dụng bộ nhớ và chi phí tính toán trong việc suy luận văn bản dài so với phiên bản V3.2 trước đó.