DeepSeek hat TileKernels veröffentlicht, eine GPU-Kernel-Bibliothek, die für das Training und die Inferenz großer Modelle entwickelt wurde, und zwar unter der MIT-Lizenz. Angekündigt am 23. April, ist TileKernels in TileLang geschrieben, einer auf Python basierenden domänenspezifischen Sprache, die von tile-ai für leistungsstarke GPU-Kernel entwickelt wurde. Die Bibliothek umfasst sechs Kategorien von Kerneln, darunter MoE-Gating, Quantisierung und Engram-Gating, wobei einige Komponenten bereits intern eingesetzt werden. Diese Veröffentlichung markiert die erste öffentliche Bekanntgabe der proprietären Engram- und Manifold-HyperConnection-Komponenten von DeepSeek. Die Bibliothek erfordert GPUs mit NVIDIA SM90- oder SM100-Architektur, CUDA Toolkit 13.1 oder höher sowie PyTorch 2.10 oder höher.