DeepSeek a lancé ses modèles API V4, V4-Pro et V4-Flash, introduisant des réductions de prix significatives et une augmentation par huit de la longueur du contexte. Le modèle V4-Flash remplace la version précédente V3.2 sans augmentation de prix, offrant une entrée mise en cache à 0,2 RMB par million de tokens et réduisant les coûts d'entrée non mise en cache de 2 RMB à 1 RMB, tandis que les coûts de sortie passent de 3 RMB à 2 RMB. La longueur du contexte est passée de 128K à 1M tokens.
Le modèle V4-Pro, une nouvelle catégorie premium, est tarifé à 1 RMB pour l'entrée mise en cache, 12 RMB pour l'entrée non mise en cache, et 24 RMB pour la sortie par million de tokens, reflétant un coût plus élevé dû à une capacité de calcul haut de gamme limitée. Cependant, les prix devraient baisser après la sortie des super nœuds Ascend 950 plus tard cette année. Les deux modèles prennent en charge les modes sans raisonnement et avec raisonnement, ce dernier offrant des niveaux d'intensité élevés et maximum. Les modèles hérités, deepseek-chat et deepseek-reasoner, seront abandonnés d'ici le 24 juillet 2026.
DeepSeek V4 API dévoile V4-Pro et V4-Flash avec des réductions de prix et un contexte élargi
Avertissement : Le contenu proposé sur Phemex News est à titre informatif uniquement. Nous ne garantissons pas la qualité, l'exactitude ou l'exhaustivité des informations provenant d'articles tiers. Ce contenu ne constitue pas un conseil financier ou d'investissement. Nous vous recommandons vivement d'effectuer vos propres recherches et de consulter un conseiller financier qualifié avant toute décision d'investissement.
