Hugging Face chính thức ra mắt Kernels Hub, một giải pháp dựa trên đám mây dành cho các bộ điều khiển GPU đã được biên dịch sẵn, theo thông báo của CEO Clem Delangue. Dịch vụ mới này nhằm đơn giản hóa việc cài đặt các kernel GPU, vốn rất quan trọng để tối ưu hiệu suất card đồ họa. Trước đây, việc biên dịch các kernel này, như FlashAttention, đòi hỏi nhiều tài nguyên và thời gian, thường dẫn đến lỗi do không tương thích phiên bản. Kernels Hub giải quyết những thách thức này bằng cách cung cấp các kernel đã được biên dịch sẵn cho nhiều môi trường GPU và hệ thống khác nhau, cho phép các nhà phát triển triển khai chỉ với một dòng mã.
Dịch vụ hỗ trợ nhiều nền tảng tăng tốc phần cứng, bao gồm NVIDIA CUDA, AMD ROCm, Apple Metal và Intel XPU, và được tích hợp vào khung suy luận TGI và thư viện Transformers của Hugging Face. Ban đầu được ra mắt thử nghiệm vào tháng Sáu năm ngoái, Kernels Hub hiện đã được nâng cấp thành loại kho lưu trữ hạng nhất trên Hugging Face Hub, cùng với Models, Datasets và Spaces. Hiện tại, có 61 kernel đã được biên dịch sẵn, bao phủ các trường hợp sử dụng thiết yếu như cơ chế attention và lượng tử hóa.
Hugging Face Ra Mắt Kernels Hub Để Tối Ưu GPU Hiệu Quả Hơn
Tuyên bố miễn trừ trách nhiệm: Nội dung được cung cấp trên Phemex News chỉ nhằm mục đích cung cấp thông tin.Chúng tôi không đảm bảo chất lượng, độ chính xác hoặc tính đầy đủ của thông tin có nguồn từ các bài viết của bên thứ ba.Nội dung trên trang này không cấu thành lời khuyên về tài chính hoặc đầu tư.Chúng tôi đặc biệt khuyến khích bạn tự tiến hành nghiên cứu và tham khảo ý kiến của cố vấn tài chính đủ tiêu chuẩn trước khi đưa ra bất kỳ quyết định đầu tư nào.
