DeepSeek выпустила TileKernels — библиотеку GPU-ядер, предназначенную для обучения и инференса больших моделей, под лицензией MIT. Анонсированная 23 апреля, TileKernels написана на TileLang, доменно-специфическом языке на базе Python, разработанном компанией tile-ai для высокопроизводительных GPU-ядер. Библиотека включает шесть категорий ядер, таких как MoE gating, квантизация и Engram gating, при этом некоторые компоненты уже используются внутри компании. Этот релиз стал первым публичным раскрытием проприетарных компонентов DeepSeek — Engram и Manifold HyperConnection. Для работы библиотеки требуются GPU архитектуры NVIDIA SM90 или SM100, CUDA Toolkit версии 13.1 или выше и PyTorch версии 2.10 или выше.
DeepSeek открывает исходный код TileKernels для улучшенного обучения моделей на GPU
Отказ от ответственности: Контент, представленный на сайте Phemex News, предназначен исключительно для информационных целей.Мы не гарантируем качество, точность и полноту информации, полученной из статей третьих лиц.Содержание этой страницы не является финансовым или инвестиционным советом.Мы настоятельно рекомендуем вам провести собственное исследование и проконсультироваться с квалифицированным финансовым консультантом, прежде чем принимать какие-либо инвестиционные решения.
