DeepSeek는 V4 API 모델인 V4-Pro와 V4-Flash를 출시하며 가격을 크게 인하하고 컨텍스트 길이를 8배로 늘렸습니다. V4-Flash 모델은 이전 V3.2 버전을 대체하며 가격 인상 없이 캐시된 입력은 백만 토큰당 0.2 RMB, 캐시되지 않은 입력 비용은 2 RMB에서 1 RMB로, 출력 비용은 3 RMB에서 2 RMB로 인하되었습니다. 컨텍스트 길이는 128K에서 1M 토큰으로 확장되었습니다. 새로운 프리미엄 등급인 V4-Pro 모델은 캐시된 입력에 대해 백만 토큰당 1 RMB, 캐시되지 않은 입력에 대해 12 RMB, 출력에 대해 24 RMB로 책정되었으며, 이는 제한된 고성능 컴퓨팅 용량으로 인한 높은 비용을 반영합니다. 그러나 올해 말 Ascend 950 슈퍼 노드 출시 이후 가격이 하락할 것으로 예상됩니다. 두 모델 모두 비추론 모드와 추론 모드를 지원하며, 후자는 높은 강도와 최대 강도 수준을 제공합니다. 기존 모델인 deepseek-chat과 deepseek-reasoner는 2026년 7월 24일까지 서비스가 종료될 예정입니다.