A DeepSeek lançou seus modelos de API V4, V4-Pro e V4-Flash, introduzindo reduções significativas de preço e um aumento de oito vezes no comprimento do contexto. O modelo V4-Flash substitui a versão anterior V3.2 sem aumento de preço, oferecendo entrada em cache a 0,2 RMB por milhão de tokens e reduzindo os custos de entrada não em cache de 2 RMB para 1 RMB, enquanto os custos de saída caem de 3 RMB para 2 RMB. O comprimento do contexto foi ampliado de 128K para 1M tokens. O modelo V4-Pro, um novo nível premium, tem preço de 1 RMB para entrada em cache, 12 RMB para entrada não em cache e 24 RMB para saída por milhão de tokens, refletindo um custo mais alto devido à capacidade limitada de computação de alto desempenho. No entanto, espera-se que os preços diminuam após o lançamento dos super nós Ascend 950 ainda este ano. Ambos os modelos suportam modos sem raciocínio e com raciocínio, sendo que este último oferece níveis de intensidade alta e máxima. Os modelos legados, deepseek-chat e deepseek-reasoner, serão descontinuados até 24 de julho de 2026.