Tongyi Labは4月20日に最新の音声認識モデル「Fun-ASR 1.5」を発表しました。このモデルは現在、Alibaba CloudのBailianおよびModelScopeコミュニティを通じて利用可能で、30言語、7つの主要な中国語方言グループ、そして20以上の地域アクセントを単一のモデルでサポートしています。これにより、各方言ごとに別々のモデルを用意する必要がなくなりました。内部テストでは、前バージョンと比較して方言シナリオにおける文字誤り率が56.2%減少し、5つの方言で90%以上の精度を達成しています。
また、このモデルは古典詩の認識も強化しており、文字レベルで97%の精度を誇ります。この統合システムは、中国語方言の音声認識におけるロングテール問題に対応しており、教育のライブストリーミング、地方自治体のホットライン、インタビューの文字起こしなどの商用利用に適しており、複数の認識パイプラインを必要としないため、展開が簡素化されています。
Tongyi Lab、高度な方言認識機能を備えたFun-ASR 1.5を発表
免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。
