Google a lancé Gemini 3.1 Flash TTS, un modèle de synthèse vocale de nouvelle génération qui permet aux développeurs de contrôler avec précision la parole générée par l'IA. Disponible via l'API Gemini, Google AI Studio, Vertex AI et Google Vids, ce modèle utilise des "balises audio" pour ajuster le ton, le rythme et l'accent, même en plein milieu d'une phrase. Il prend en charge plus de 70 langues et inclut des filigranes SynthID pour l'identification du contenu. Le modèle se classe premier au classement TTS d'Artificial Analysis, avec un score Elo de 1 211, et est conçu pour transformer la synthèse vocale en un moteur de performance vocale programmable.