DeepSeek는 Hugging Face와 ModelScope와 같은 플랫폼에서 MIT 라이선스 하에 제공되는 V4 시리즈 오픈 소스 모델의 미리보기 버전을 출시했습니다. V4 시리즈는 두 가지 MoE 모델을 특징으로 합니다: 약 1.6조 개의 파라미터와 토큰당 490억 개가 활성화되는 V4-Pro, 그리고 2840억 개의 파라미터와 토큰당 130억 개가 활성화되는 V4-Flash입니다. 두 모델 모두 최대 100만 토큰의 컨텍스트 길이를 지원합니다. 새로운 모델들은 이전 V3.2 버전에 비해 긴 텍스트 추론 시 메모리 사용량과 계산 부담이 줄어들 것을 약속합니다.
DeepSeek, 1.6조 파라미터의 V4 오픈소스 모델 공개
면책 조항: Phemex 뉴스에서 제공하는 콘텐츠는 정보 제공 목적으로만 제공됩니다. 제3자 기사에서 출처를 얻은 정보의 품질, 정확성 또는 완전성을 보장하지 않습니다.이 페이지의 콘텐츠는 재무 또는 투자 조언이 아닙니다.투자 결정을 내리기 전에 반드시 스스로 조사하고 자격을 갖춘 재무 전문가와 상담하시기 바랍니다.
