StepAudio 2.5 ASR Debuta con Tecnología MTP para una Transcripción Mejorada

Jiepao Xingchen ha lanzado su avanzado modelo de reconocimiento automático de voz, StepAudio 2.5 ASR, que cuenta con la tecnología de Predicción Multi-Token (MTP). Esta innovación acelera la velocidad de inferencia y utiliza una ventana de contexto de 32K, permitiendo la transcripción continua de audio de 30 minutos sin necesidad de segmentación. La arquitectura ASR+MTP-5 del modelo incrementa el rendimiento de inferencia en un 400%, reduce la latencia en un 60% y disminuye los costos en un 80%, alcanzando una tasa máxima de 500 tokens por segundo. Las pruebas muestran una mayor precisión y menores tasas de error de palabras en comparación con los competidores.

Fuente: Mostrar original

Aviso legal: El contenido de Phemex News es únicamente informativo.No garantizamos la calidad, precisión ni integridad de la información procedente de artículos de terceros.El contenido de esta página no constituye asesoramiento financiero ni de inversión.Le recomendamos encarecidamente que realice su propia investigación y consulte con un asesor financiero cualificado antes de tomar cualquier decisión de inversión.

También te podría gustar