StepAudio 2.5 ASR estreia com tecnologia MTP para transcrição aprimorada

Jiepao Xingchen lançou seu avançado modelo de reconhecimento automático de fala, StepAudio 2.5 ASR, que apresenta a tecnologia de Previsão Multi-Token (MTP). Essa inovação acelera a velocidade de inferência e utiliza uma janela de contexto de 32K, permitindo a transcrição contínua de áudio de 30 minutos sem cortes. A arquitetura ASR+MTP-5 do modelo aumenta a taxa de processamento de inferência em 400%, reduz a latência em 60% e diminui os custos em 80%, alcançando uma taxa máxima de 500 tokens por segundo. Testes mostram maior precisão e taxas de erro de palavras mais baixas em comparação com os concorrentes.

Fonte: Mostrar original

Aviso Legal: O conteúdo disponibilizado no Phemex News é apenas para fins informativos. Não garantimos a qualidade, precisão ou integridade das informações provenientes de artigos de terceiros. Este conteúdo não constitui aconselhamento financeiro ou de investimento. Recomendamos fortemente que você realize suas próprias pesquisas e consulte um consultor financeiro qualificado antes de tomar decisões de investimento.

Você também pode gostar