Google запустила Gemini 3.1 Flash TTS — модель синтеза речи нового поколения, которая позволяет разработчикам точно контролировать речь, сгенерированную ИИ. Модель доступна через Gemini API, Google AI Studio, Vertex AI и Google Vids. Она использует «аудиотеги» для настройки тона, ритма и акцента, даже в середине предложения. Поддерживается более 70 языков, а также включены водяные знаки SynthID для идентификации контента. Модель занимает первое место в рейтинге TTS по версии Artificial Analysis с рейтингом Эло 1211 и предназначена для преобразования синтеза речи в программируемый голосовой исполнительный движок.
Google представила Gemini 3.1 Flash TTS для продвинутого управления речью с помощью ИИ
Отказ от ответственности: Контент, представленный на сайте Phemex News, предназначен исключительно для информационных целей.Мы не гарантируем качество, точность и полноту информации, полученной из статей третьих лиц.Содержание этой страницы не является финансовым или инвестиционным советом.Мы настоятельно рекомендуем вам провести собственное исследование и проконсультироваться с квалифицированным финансовым консультантом, прежде чем принимать какие-либо инвестиционные решения.
