Google lanza precios escalonados para API Gemini

Google ha introducido una nueva estrategia de precios escalonados para su API Gemini, ofreciendo cinco niveles de servicio distintos: Estándar, Flexible, Prioritario, Por Lotes y Caché. Los niveles Flexible y Por Lotes ofrecen un descuento del 50% sobre las tarifas estándar, atendiendo respectivamente a aplicaciones con baja sensibilidad a la latencia y necesidades de procesamiento de datos a gran escala. El nivel Caché está diseñado para llamadas de instrucciones complejas y de alta frecuencia, con facturación basada en el conteo de tokens y la duración del almacenamiento. El nivel Prioritario, con un precio entre un 75% y un 100% superior a la tarifa estándar, garantiza tiempos de respuesta rápidos desde milisegundos hasta segundos, lo que lo hace adecuado para aplicaciones críticas como bots de atención al cliente y detección de fraudes en tiempo real. Este nuevo modelo de precios busca optimizar la asignación de recursos para servicios de inferencia de IA, acomodando diferentes requisitos de latencia y costo.