Google presenta Gemini 3.1 Flash TTS para un control avanzado del habla con IA

Google ha lanzado Gemini 3.1 Flash TTS, un modelo de texto a voz de próxima generación que permite a los desarrolladores controlar con precisión el habla generada por IA. Disponible a través de la API de Gemini, Google AI Studio, Vertex AI y Google Vids, el modelo utiliza "etiquetas de audio" para ajustar el tono, el ritmo y el acento, incluso a mitad de la frase. Soporta más de 70 idiomas e incluye marcas de agua SynthID para la identificación de contenido. El modelo ocupa el primer lugar en la tabla de clasificación de TTS según Artificial Analysis, con una puntuación Elo de 1,211, y está diseñado para transformar el TTS en un motor de rendimiento de voz programable.

Fuente: Mostrar original

Aviso legal: El contenido de Phemex News es únicamente informativo.No garantizamos la calidad, precisión ni integridad de la información procedente de artículos de terceros.El contenido de esta página no constituye asesoramiento financiero ni de inversión.Le recomendamos encarecidamente que realice su propia investigación y consulte con un asesor financiero cualificado antes de tomar cualquier decisión de inversión.