Jiepao Xingchen lançou seu avançado modelo de reconhecimento automático de fala, StepAudio 2.5 ASR, que apresenta a tecnologia de Previsão Multi-Token (MTP). Essa inovação acelera a velocidade de inferência e utiliza uma janela de contexto de 32K, permitindo a transcrição contínua de áudio de 30 minutos sem cortes. A arquitetura ASR+MTP-5 do modelo aumenta a taxa de processamento de inferência em 400%, reduz a latência em 60% e diminui os custos em 80%, alcançando uma taxa máxima de 500 tokens por segundo. Testes mostram maior precisão e taxas de erro de palavras mais baixas em comparação com os concorrentes.