Google, geliştiricilerin yapay zeka tarafından oluşturulan konuşmayı hassasiyetle kontrol etmelerini sağlayan yeni nesil bir metinden sese modeli olan Gemini 3.1 Flash TTS'yi piyasaya sürdü. Gemini API, Google AI Studio, Vertex AI ve Google Vids üzerinden erişilebilen bu model, cümle ortasında bile ton, ritim ve aksanı ayarlamak için "ses etiketleri" kullanıyor. 70'ten fazla dili destekleyen model, içerik tanımlaması için SynthID filigranları içeriyor. Model, Artificial Analysis tarafından hazırlanan TTS sıralamasında 1.211 Elo puanı ile birinci sırada yer almakta ve TTS'yi programlanabilir bir ses performans motoruna dönüştürmek üzere tasarlanmıştır.
Google, Gelişmiş Yapay Zeka Konuşma Kontrolü için Gemini 3.1 Flash TTS'yi Tanıttı
Sorumluluk Reddi: Phemex Haberler'de sunulan içerik yalnızca bilgilendirme amaçlıdır. Üçüncü taraf makalelerden alınan bilgilerin kalitesi, doğruluğu veya eksiksizliğini garanti etmiyoruz. Bu sayfadaki içerik finansal veya yatırım tavsiyesi niteliği taşımaz. Yatırım kararları vermeden önce kendi araştırmanızı yapmanızı ve nitelikli bir finans danışmanına başvurmanızı şiddetle tavsiye ederiz.
