Google、先進的なAI音声制御のためのGemini 3.1 Flash TTSを発表

Googleは、開発者がAI生成音声を精密に制御できる次世代のテキスト読み上げモデル「Gemini 3.1 Flash TTS」を発表しました。Gemini API、Google AI Studio、Vertex AI、Google Vidsを通じて利用可能で、このモデルは「オーディオタグ」を使用して、文の途中でもトーン、リズム、アクセントを調整できます。70以上の言語に対応し、コンテンツ識別のためのSynthIDウォーターマークも含まれています。このモデルはArtificial AnalysisのTTSランキングでエロースコア1,211を獲得し1位にランクインしており、TTSをプログラム可能な音声パフォーマンスエンジンへと変革することを目指しています。

出典: 原文を表示

免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。