Lancement DeepSeek V4 API : prix réduits et contexte élargi

DeepSeek a lancé ses modèles API V4, V4-Pro et V4-Flash, introduisant des réductions de prix significatives et une augmentation par huit de la longueur du contexte. Le modèle V4-Flash remplace la version précédente V3.2 sans augmentation de prix, offrant une entrée mise en cache à 0,2 RMB par million de tokens et réduisant les coûts d'entrée non mise en cache de 2 RMB à 1 RMB, tandis que les coûts de sortie passent de 3 RMB à 2 RMB. La longueur du contexte est passée de 128K à 1M tokens. Le modèle V4-Pro, une nouvelle catégorie premium, est tarifé à 1 RMB pour l'entrée mise en cache, 12 RMB pour l'entrée non mise en cache, et 24 RMB pour la sortie par million de tokens, reflétant un coût plus élevé dû à une capacité de calcul haut de gamme limitée. Cependant, les prix devraient baisser après la sortie des super nœuds Ascend 950 plus tard cette année. Les deux modèles prennent en charge les modes sans raisonnement et avec raisonnement, ce dernier offrant des niveaux d'intensité élevés et maximum. Les modèles hérités, deepseek-chat et deepseek-reasoner, seront abandonnés d'ici le 24 juillet 2026.