Google a introduit une nouvelle stratégie tarifaire à paliers pour son API Gemini, proposant cinq niveaux de service distincts : Standard, Flexible, Prioritaire, Batch et Cache. Les niveaux Flexible et Batch offrent une réduction de 50 % sur les tarifs standards, répondant respectivement aux besoins des applications peu sensibles à la latence et à ceux de traitement de données à grande échelle. Le niveau Cache est conçu pour les appels d'instructions complexes à haute fréquence, avec une facturation basée sur le nombre de jetons et la durée de stockage.
Le niveau Prioritaire, tarifé entre 75 % et 100 % plus cher que le tarif standard, garantit des temps de réponse rapides allant de quelques millisecondes à quelques secondes, ce qui le rend adapté aux applications critiques telles que les bots de service client et la détection de fraude en temps réel. Ce nouveau modèle tarifaire vise à optimiser l'allocation des ressources pour les services d'inférence IA, en tenant compte des exigences variables en matière de latence et de coût.
Google dévoile une tarification par paliers pour l'API Gemini avec des options de service améliorées
Avertissement : Le contenu proposé sur Phemex News est à titre informatif uniquement. Nous ne garantissons pas la qualité, l'exactitude ou l'exhaustivité des informations provenant d'articles tiers. Ce contenu ne constitue pas un conseil financier ou d'investissement. Nous vous recommandons vivement d'effectuer vos propres recherches et de consulter un conseiller financier qualifié avant toute décision d'investissement.
