구글은 Gemini API에 대해 새로운 계층별 가격 전략을 도입하여 다섯 가지 서비스 수준을 제공합니다: 표준(Standard), 유연(Flexible), 우선(Priority), 배치(Batch), 캐시(Cache). 유연 및 배치 계층은 각각 지연 시간에 민감하지 않은 애플리케이션과 대규모 데이터 처리 요구에 맞춰 표준 요금의 50% 할인을 제공합니다. 캐시 계층은 고빈도 복잡한 명령 호출을 위해 설계되었으며, 토큰 수와 저장 기간에 따라 요금이 부과됩니다. 우선 계층은 표준 요금보다 75%에서 100% 더 높은 가격으로 책정되며, 밀리초에서 초 단위의 빠른 응답 시간을 보장하여 고객 서비스 봇이나 실시간 사기 탐지와 같은 중요한 애플리케이션에 적합합니다. 이 새로운 가격 모델은 AI 추론 서비스의 자원 할당을 최적화하여 다양한 지연 시간과 비용 요구를 충족하는 것을 목표로 합니다.