DeepSeek đã ra mắt các mô hình API V4 của mình, V4-Pro và V4-Flash, giới thiệu mức giảm giá đáng kể và tăng gấp tám lần độ dài ngữ cảnh. Mô hình V4-Flash thay thế phiên bản V3.2 trước đó mà không tăng giá, cung cấp đầu vào được lưu trong bộ nhớ đệm với giá 0,2 RMB cho mỗi triệu token và giảm chi phí đầu vào không được lưu trong bộ nhớ đệm từ 2 RMB xuống còn 1 RMB, trong khi chi phí đầu ra giảm từ 3 RMB xuống còn 2 RMB. Độ dài ngữ cảnh đã được mở rộng từ 128K lên 1 triệu token. Mô hình V4-Pro, một cấp độ cao cấp mới, có giá 1 RMB cho đầu vào được lưu trong bộ nhớ đệm, 12 RMB cho đầu vào không được lưu trong bộ nhớ đệm và 24 RMB cho đầu ra mỗi triệu token, phản ánh chi phí cao hơn do hạn chế về năng lực tính toán cao cấp. Tuy nhiên, giá dự kiến sẽ giảm sau khi các nút siêu Ascend 950 được ra mắt vào cuối năm nay. Cả hai mô hình đều hỗ trợ chế độ không suy luận và suy luận, với chế độ sau cung cấp các mức cường độ cao và tối đa. Các mô hình cũ, deepseek-chat và deepseek-reasoner, sẽ bị ngừng hoạt động vào ngày 24 tháng 7 năm 2026.