Google ha lanzado Gemini 3.1 Flash TTS, un modelo de texto a voz de próxima generación que permite a los desarrolladores controlar con precisión el habla generada por IA. Disponible a través de la API de Gemini, Google AI Studio, Vertex AI y Google Vids, el modelo utiliza "etiquetas de audio" para ajustar el tono, el ritmo y el acento, incluso a mitad de la frase. Soporta más de 70 idiomas e incluye marcas de agua SynthID para la identificación de contenido. El modelo ocupa el primer lugar en la tabla de clasificación de TTS según Artificial Analysis, con una puntuación Elo de 1,211, y está diseñado para transformar el TTS en un motor de rendimiento de voz programable.