Google a introduit une nouvelle stratégie tarifaire à paliers pour son API Gemini, proposant cinq niveaux de service distincts : Standard, Flexible, Prioritaire, Batch et Cache. Les niveaux Flexible et Batch offrent une réduction de 50 % sur les tarifs standards, répondant respectivement aux besoins des applications peu sensibles à la latence et à ceux de traitement de données à grande échelle. Le niveau Cache est conçu pour les appels d'instructions complexes à haute fréquence, avec une facturation basée sur le nombre de jetons et la durée de stockage. Le niveau Prioritaire, tarifé entre 75 % et 100 % plus cher que le tarif standard, garantit des temps de réponse rapides allant de quelques millisecondes à quelques secondes, ce qui le rend adapté aux applications critiques telles que les bots de service client et la détection de fraude en temps réel. Ce nouveau modèle tarifaire vise à optimiser l'allocation des ressources pour les services d'inférence IA, en tenant compte des exigences variables en matière de latence et de coût.