O Google lançou o Gemini 3.1 Flash TTS, um modelo de texto para fala de próxima geração que permite aos desenvolvedores controlar a fala gerada por IA com precisão. Disponível através da API Gemini, Google AI Studio, Vertex AI e Google Vids, o modelo utiliza "tags de áudio" para ajustar tom, ritmo e sotaque, mesmo no meio da frase. Ele suporta mais de 70 idiomas e inclui marcas d'água SynthID para identificação de conteúdo. O modelo ocupa o primeiro lugar no ranking de TTS da Artificial Analysis, com uma pontuação Elo de 1.211, e foi projetado para transformar o TTS em um motor de performance vocal programável.