Hugging Face ra mắt Kernels Hub tối ưu GPU

Hugging Face chính thức ra mắt Kernels Hub, một giải pháp dựa trên đám mây dành cho các bộ điều khiển GPU đã được biên dịch sẵn, theo thông báo của CEO Clem Delangue. Dịch vụ mới này nhằm đơn giản hóa việc cài đặt các kernel GPU, vốn rất quan trọng để tối ưu hiệu suất card đồ họa. Trước đây, việc biên dịch các kernel này, như FlashAttention, đòi hỏi nhiều tài nguyên và thời gian, thường dẫn đến lỗi do không tương thích phiên bản. Kernels Hub giải quyết những thách thức này bằng cách cung cấp các kernel đã được biên dịch sẵn cho nhiều môi trường GPU và hệ thống khác nhau, cho phép các nhà phát triển triển khai chỉ với một dòng mã. Dịch vụ hỗ trợ nhiều nền tảng tăng tốc phần cứng, bao gồm NVIDIA CUDA, AMD ROCm, Apple Metal và Intel XPU, và được tích hợp vào khung suy luận TGI và thư viện Transformers của Hugging Face. Ban đầu được ra mắt thử nghiệm vào tháng Sáu năm ngoái, Kernels Hub hiện đã được nâng cấp thành loại kho lưu trữ hạng nhất trên Hugging Face Hub, cùng với Models, Datasets và Spaces. Hiện tại, có 61 kernel đã được biên dịch sẵn, bao phủ các trường hợp sử dụng thiết yếu như cơ chế attention và lượng tử hóa.

Bạn cũng có thể thích