통이 랩은 4월 20일 최신 음성 인식 모델인 Fun-ASR 1.5를 출시했습니다. 이 모델은 현재 알리바바 클라우드의 바이롄과 ModelScope 커뮤니티를 통해 제공되며, 단일 모델로 30개 언어, 7개의 주요 중국어 방언 그룹, 그리고 20개 이상의 지역 억양을 지원합니다. 이를 통해 각 방언별로 별도의 모델이 필요하지 않게 되었습니다. 내부 테스트 결과, 이전 버전과 비교하여 방언 시나리오에서 문자 오류율이 56.2% 감소했으며, 5개의 방언은 90% 이상의 정확도를 달성했습니다. 이 모델은 또한 고전 시에 대한 인식 능력이 향상되어 문자 수준 정확도가 97%에 달합니다. 이 통합 시스템은 중국어 방언 음성 인식의 롱테일 문제를 해결하여 교육용 라이브 스트리밍, 지방 정부 핫라인, 인터뷰 전사 등 상업적 응용에 적합하며, 여러 인식 파이프라인이 필요 없도록 하여 배포를 간소화합니다.