StepAudio 2.5 ASR Ra Mắt với Công Nghệ MTP Tăng Cường Chuyển Văn Bản

Jiepao Xingchen đã ra mắt mô hình nhận dạng giọng nói tự động tiên tiến của mình, StepAudio 2.5 ASR, với công nghệ Dự đoán Đa Token (MTP). Đổi mới này tăng tốc độ suy luận và sử dụng cửa sổ ngữ cảnh 32K, cho phép phiên âm liền mạch âm thanh 30 phút mà không cần cắt nhỏ. Kiến trúc ASR+MTP-5 của mô hình tăng thông lượng suy luận lên 400%, giảm độ trễ 60% và cắt giảm chi phí 80%, đạt tốc độ đỉnh 500 token mỗi giây. Các bài kiểm tra cho thấy độ chính xác được cải thiện và tỷ lệ lỗi từ thấp hơn so với các đối thủ cạnh tranh.

Nguồn: Hiển thị bản gốc

Tuyên bố miễn trừ trách nhiệm: Nội dung được cung cấp trên Phemex News chỉ nhằm mục đích cung cấp thông tin.Chúng tôi không đảm bảo chất lượng, độ chính xác hoặc tính đầy đủ của thông tin có nguồn từ các bài viết của bên thứ ba.Nội dung trên trang này không cấu thành lời khuyên về tài chính hoặc đầu tư.Chúng tôi đặc biệt khuyến khích bạn tự tiến hành nghiên cứu và tham khảo ý kiến của cố vấn tài chính đủ tiêu chuẩn trước khi đưa ra bất kỳ quyết định đầu tư nào.

Bạn cũng có thể thích