Google, Gemini API'si için beş farklı hizmet seviyesi sunan yeni bir kademeli fiyatlandırma stratejisi tanıttı: Standart, Esnek, Öncelikli, Toplu ve Önbellek. Esnek ve Toplu katmanlar, sırasıyla düşük gecikme duyarlılığına sahip uygulamalar ve büyük ölçekli veri işleme ihtiyaçları için standart fiyatlarda %50 indirim sağlıyor. Önbellek katmanı ise yüksek frekanslı, karmaşık talimat çağrıları için tasarlanmış olup, faturalandırma token sayısı ve depolama süresine göre yapılmaktadır. Öncelikli katman, standart fiyatın %75 ila %100 üzerinde fiyatlandırılarak milisaniyelerden saniyelere kadar hızlı yanıt süreleri garanti eder ve müşteri hizmetleri botları ile gerçek zamanlı dolandırıcılık tespiti gibi kritik uygulamalar için uygundur. Bu yeni fiyatlandırma modeli, AI çıkarım hizmetleri için kaynak tahsisini optimize etmeyi ve farklı gecikme ve maliyet gereksinimlerini karşılamayı amaçlamaktadır.