Xiaomiは、MiMoオープンプラットフォームAPIを通じて利用可能な新しいテキスト読み上げモデルのシリーズ、MiMo-V2.5-TTSシリーズを発表しました。このシリーズは公開テスト期間中は無料で提供されており、さまざまな用途に対応した3つのモデルが含まれています。MiMo-V2.5-TTSは高品質な音声トーンと、ピッチやリズムを正確に捉える歌唱モードを提供します。MiMo-V2.5-TTS-VoiceDesignは単一の説明から新しい音声トーンを作成でき、MiMo-V2.5-TTS-VoiceCloneは最小限の参照音声で音声クローンを可能にします。
これらのモデルは、「優しく疲れた」などの自然言語コマンドによる話し方の調整や、「息を吸う」や「すすり泣き」といった音声タグによる精密な制御をサポートしています。中国語、英語、地域方言を含む複数の言語に対応し、音声出力は24,000Hzでサンプリングされています。このリリースは、Xiaomiのテキスト読み上げ技術における大きな進歩を示しており、多用途でカスタマイズ可能な音声ソリューションを提供します。
Xiaomi、先進音声機能を搭載したMiMo-V2.5-TTSシリーズを発表
免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。
