Jiepao Xingchenは、高度な自動音声認識モデルであるStepAudio 2.5 ASRを発表しました。このモデルはマルチトークン予測(MTP)技術を搭載しており、推論速度を加速させ、32Kのコンテキストウィンドウを活用することで、30分間の音声を切り分けることなくシームレスに文字起こしすることが可能です。ASR+MTP-5アーキテクチャにより、推論スループットは400%向上し、レイテンシは60%削減、コストは80%削減され、最大500トークン/秒の処理速度を達成しています。テストでは、競合他社と比較して精度が向上し、単語誤り率が低減していることが示されています。