Tencent Cloud s'apprête à lancer la version officielle de son modèle DeepSeek-V4 sur sa plateforme TokenHub à la mi-juillet. Le nouveau modèle adoptera une approche de « fourniture directe d'usine » et introduira un mécanisme de facturation en heures de pointe et heures creuses. Pendant les heures creuses, DeepSeek-V4-Pro facturera 0,025 yuan par cache hit, 3 yuans pour l'entrée d'inférence et 6 yuans pour la sortie d'inférence par million de tokens. Les tarifs en heures de pointe doubleront respectivement à 0,05 yuan, 6 yuans et 12 yuans. DeepSeek-V4-Flash appliquera des frais en heures creuses de 0,02 yuan par cache hit, 1 yuan pour l'entrée d'inférence et 2 yuans pour la sortie d'inférence, avec des tarifs en heures de pointe fixés à 0,04 yuan, 2 yuans et 4 yuans. Les heures de pointe sont définies de 9h00 à 12h00 et de 14h00 à 18h00 (UTC+8). Des ajustements des règles de déduction de crédits de l'édition Entreprise du Token Plan seront également mis en œuvre pour différentes périodes.