DeepSeek đã phát hành TileKernels, một thư viện kernel GPU được thiết kế cho việc đào tạo và suy luận các mô hình lớn, dưới giấy phép MIT. Được công bố vào ngày 23 tháng 4, TileKernels được viết bằng TileLang, một ngôn ngữ đặc thù dựa trên Python do tile-ai phát triển dành cho các kernel GPU hiệu suất cao. Thư viện bao gồm sáu loại kernel, như MoE gating, lượng tử hóa và Engram gating, với một số thành phần đã được triển khai nội bộ. Phiên bản phát hành này đánh dấu lần đầu tiên công khai các thành phần độc quyền Engram và Manifold HyperConnection của DeepSeek. Thư viện yêu cầu GPU kiến trúc NVIDIA SM90 hoặc SM100, CUDA Toolkit 13.1 trở lên và PyTorch 2.10 trở lên.
DeepSeek Mở Mã Nguồn TileKernels để Nâng Cao Đào Tạo Mô Hình GPU
Tuyên bố miễn trừ trách nhiệm: Nội dung được cung cấp trên Phemex News chỉ nhằm mục đích cung cấp thông tin.Chúng tôi không đảm bảo chất lượng, độ chính xác hoặc tính đầy đủ của thông tin có nguồn từ các bài viết của bên thứ ba.Nội dung trên trang này không cấu thành lời khuyên về tài chính hoặc đầu tư.Chúng tôi đặc biệt khuyến khích bạn tự tiến hành nghiên cứu và tham khảo ý kiến của cố vấn tài chính đủ tiêu chuẩn trước khi đưa ra bất kỳ quyết định đầu tư nào.
