Jiepao Xingchen은 다중 토큰 예측(MTP) 기술을 탑재한 고급 자동 음성 인식 모델인 StepAudio 2.5 ASR을 출시했습니다. 이 혁신은 추론 속도를 가속화하고 32K 컨텍스트 창을 활용하여 30분 길이의 오디오를 자르지 않고도 원활하게 전사할 수 있게 합니다. 이 모델의 ASR+MTP-5 아키텍처는 추론 처리량을 400% 향상시키고 지연 시간을 60% 줄이며 비용을 80% 절감하여 초당 500토큰의 최고 속도를 달성합니다. 테스트 결과 경쟁사에 비해 정확도가 향상되고 단어 오류율이 낮아졌습니다.