O Google lançou o Gemini 3.1 Flash TTS, um modelo de texto para fala de próxima geração que permite aos desenvolvedores controlar a fala gerada por IA com precisão. Disponível através da API Gemini, Google AI Studio, Vertex AI e Google Vids, o modelo utiliza "tags de áudio" para ajustar tom, ritmo e sotaque, mesmo no meio da frase. Ele suporta mais de 70 idiomas e inclui marcas d'água SynthID para identificação de conteúdo. O modelo ocupa o primeiro lugar no ranking de TTS da Artificial Analysis, com uma pontuação Elo de 1.211, e foi projetado para transformar o TTS em um motor de performance vocal programável.
Google Lança Gemini 3.1 Flash TTS para Controle Avançado de Fala por IA
Aviso Legal: O conteúdo disponibilizado no Phemex News é apenas para fins informativos. Não garantimos a qualidade, precisão ou integridade das informações provenientes de artigos de terceiros. Este conteúdo não constitui aconselhamento financeiro ou de investimento. Recomendamos fortemente que você realize suas próprias pesquisas e consulte um consultor financeiro qualificado antes de tomar decisões de investimento.
