통이 랩은 4월 20일 최신 음성 인식 모델인 Fun-ASR 1.5를 출시했습니다. 이 모델은 현재 알리바바 클라우드의 바이롄과 ModelScope 커뮤니티를 통해 제공되며, 단일 모델로 30개 언어, 7개의 주요 중국어 방언 그룹, 그리고 20개 이상의 지역 억양을 지원합니다. 이를 통해 각 방언별로 별도의 모델이 필요하지 않게 되었습니다. 내부 테스트 결과, 이전 버전과 비교하여 방언 시나리오에서 문자 오류율이 56.2% 감소했으며, 5개의 방언은 90% 이상의 정확도를 달성했습니다.
이 모델은 또한 고전 시에 대한 인식 능력이 향상되어 문자 수준 정확도가 97%에 달합니다. 이 통합 시스템은 중국어 방언 음성 인식의 롱테일 문제를 해결하여 교육용 라이브 스트리밍, 지방 정부 핫라인, 인터뷰 전사 등 상업적 응용에 적합하며, 여러 인식 파이프라인이 필요 없도록 하여 배포를 간소화합니다.
통이 연구소, 고급 방언 인식 기능 탑재한 Fun-ASR 1.5 공개
면책 조항: Phemex 뉴스에서 제공하는 콘텐츠는 정보 제공 목적으로만 제공됩니다. 제3자 기사에서 출처를 얻은 정보의 품질, 정확성 또는 완전성을 보장하지 않습니다.이 페이지의 콘텐츠는 재무 또는 투자 조언이 아닙니다.투자 결정을 내리기 전에 반드시 스스로 조사하고 자격을 갖춘 재무 전문가와 상담하시기 바랍니다.
