Hugging Faceは、CEOのクレム・デランゲ氏の発表により、事前にコンパイルされたGPUオペレーター向けのクラウドベースソリューション「Kernels Hub」を正式にリリースしました。この新サービスは、グラフィックスカードのパフォーマンス最適化に不可欠なGPUカーネルのインストールを簡素化することを目的としています。従来、FlashAttentionのようなカーネルのコンパイルには多大なリソースと時間が必要であり、バージョンの不一致によるエラーが頻発していました。Kernels Hubは、さまざまなGPUおよびシステム環境向けに事前にコンパイルされたカーネルを提供することでこれらの課題に対応し、開発者が一行のコードで実装できるようにしています。
このサービスは、NVIDIA CUDA、AMD ROCm、Apple Metal、Intel XPUなど複数のハードウェアアクセラレーションプラットフォームをサポートしており、Hugging Faceの推論フレームワークTGIおよびTransformersライブラリに統合されています。昨年6月にテストとして初めて公開されて以来、Kernels Hubは現在、Models、Datasets、Spacesと並ぶHugging Face Hubの第一級リポジトリタイプに昇格しました。現在、61の事前コンパイル済みカーネルが利用可能で、注意機構や量子化などの重要なユースケースをカバーしています。
Hugging Face、GPU最適化を効率化するKernels Hubを発表
免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。
