Sierra đã công khai mã nguồn của μ-Bench, một bộ dữ liệu chuẩn nhận dạng giọng nói tự động (ASR) đa ngôn ngữ, nhằm nâng cao việc đánh giá trong môi trường dịch vụ khách hàng. Bộ dữ liệu bao gồm 250 bản ghi dịch vụ khách hàng thực tế và 4.270 đoạn âm thanh được chú thích, khắc phục những hạn chế của các bộ chuẩn hiện tại tập trung vào tiếng Anh. μ-Bench hỗ trợ năm ngôn ngữ — tiếng Anh, tiếng Tây Ban Nha, tiếng Thổ Nhĩ Kỳ, tiếng Việt và tiếng Quan Thoại — và có các kết quả hiệu suất từ các nhà cung cấp như Google và Microsoft. Bộ chuẩn này giới thiệu chỉ số Tỷ lệ Lỗi Câu (UER), phân biệt giữa các lỗi ảnh hưởng đến ý nghĩa và những lỗi không ảnh hưởng, cung cấp một đánh giá tinh tế hơn so với Tỷ lệ Lỗi Từ (WER) truyền thống. Google Chirp-3 dẫn đầu về độ chính xác, trong khi Deepgram Nova-3 nổi bật về tốc độ nhưng kém hơn về độ chính xác đa ngôn ngữ. Bộ dữ liệu và bảng xếp hạng có sẵn trên Hugging Face, mời gọi sự tham gia thêm từ các nhà cung cấp khác.