Jiepao Xingchen ha lanzado su avanzado modelo de reconocimiento automático de voz, StepAudio 2.5 ASR, que cuenta con la tecnología de Predicción Multi-Token (MTP). Esta innovación acelera la velocidad de inferencia y utiliza una ventana de contexto de 32K, permitiendo la transcripción continua de audio de 30 minutos sin necesidad de segmentación. La arquitectura ASR+MTP-5 del modelo incrementa el rendimiento de inferencia en un 400%, reduce la latencia en un 60% y disminuye los costos en un 80%, alcanzando una tasa máxima de 500 tokens por segundo. Las pruebas muestran una mayor precisión y menores tasas de error de palabras en comparación con los competidores.