Google dévoile Gemini 3.1 Flash TTS pour un contrôle vocal avancé par IA

Google a lancé Gemini 3.1 Flash TTS, un modèle de synthèse vocale de nouvelle génération qui permet aux développeurs de contrôler avec précision la parole générée par l'IA. Disponible via l'API Gemini, Google AI Studio, Vertex AI et Google Vids, ce modèle utilise des "balises audio" pour ajuster le ton, le rythme et l'accent, même en plein milieu d'une phrase. Il prend en charge plus de 70 langues et inclut des filigranes SynthID pour l'identification du contenu. Le modèle se classe premier au classement TTS d'Artificial Analysis, avec un score Elo de 1 211, et est conçu pour transformer la synthèse vocale en un moteur de performance vocale programmable.

Source: Afficher l'original

Avertissement : Le contenu proposé sur Phemex News est à titre informatif uniquement. Nous ne garantissons pas la qualité, l'exactitude ou l'exhaustivité des informations provenant d'articles tiers. Ce contenu ne constitue pas un conseil financier ou d'investissement. Nous vous recommandons vivement d'effectuer vos propres recherches et de consulter un conseiller financier qualifié avant toute décision d'investissement.