DeepSeek는 Hugging Face와 ModelScope와 같은 플랫폼에서 MIT 라이선스 하에 제공되는 V4 시리즈 오픈 소스 모델의 미리보기 버전을 출시했습니다. V4 시리즈는 두 가지 MoE 모델을 특징으로 합니다: 약 1.6조 개의 파라미터와 토큰당 490억 개가 활성화되는 V4-Pro, 그리고 2840억 개의 파라미터와 토큰당 130억 개가 활성화되는 V4-Flash입니다. 두 모델 모두 최대 100만 토큰의 컨텍스트 길이를 지원합니다. 새로운 모델들은 이전 V3.2 버전에 비해 긴 텍스트 추론 시 메모리 사용량과 계산 부담이 줄어들 것을 약속합니다.