A DeepSeek lançou o TileKernels, uma biblioteca de kernels para GPU projetada para treinamento e inferência de grandes modelos, sob a licença MIT. Anunciado em 23 de abril, o TileKernels é escrito em TileLang, uma linguagem específica de domínio baseada em Python desenvolvida pela tile-ai para kernels de GPU de alto desempenho. A biblioteca inclui seis categorias de kernels, como MoE gating, quantização e Engram gating, com alguns componentes já implantados internamente. Este lançamento marca a primeira divulgação pública dos componentes proprietários Engram e Manifold HyperConnection da DeepSeek. A biblioteca requer GPUs com arquitetura NVIDIA SM90 ou SM100, CUDA Toolkit 13.1 ou superior e PyTorch 2.10 ou superior.
DeepSeek Torna TileKernels Open Source para Treinamento Aprimorado de Modelos em GPU
Aviso Legal: O conteúdo disponibilizado no Phemex News é apenas para fins informativos. Não garantimos a qualidade, precisão ou integridade das informações provenientes de artigos de terceiros. Este conteúdo não constitui aconselhamento financeiro ou de investimento. Recomendamos fortemente que você realize suas próprias pesquisas e consulte um consultor financeiro qualificado antes de tomar decisões de investimento.
