Googleは、開発者がAI生成音声を精密に制御できる次世代のテキスト読み上げモデル「Gemini 3.1 Flash TTS」を発表しました。Gemini API、Google AI Studio、Vertex AI、Google Vidsを通じて利用可能で、このモデルは「オーディオタグ」を使用して、文の途中でもトーン、リズム、アクセントを調整できます。70以上の言語に対応し、コンテンツ識別のためのSynthIDウォーターマークも含まれています。このモデルはArtificial AnalysisのTTSランキングでエロースコア1,211を獲得し1位にランクインしており、TTSをプログラム可能な音声パフォーマンスエンジンへと変革することを目指しています。