O desenvolvedor Manjeet Singh, junto com Claude Opus, conduziu com sucesso o treinamento de redes neurais na Neural Engine (ANE) da Apple no chip M4 por meio de engenharia reversa. Esta é a primeira vez que o treinamento foi realizado na ANE, que normalmente é usada para inferência. Ao contornar o framework CoreML da Apple, a equipe mapeou diretamente mais de 40 classes privadas para o driver do kernel IOKit, permitindo a compilação do modelo na memória — um passo crucial para o treinamento.
O projeto implementou o treinamento para uma única camada transformer, alcançando 9,3 ms por passo com 11,2% de utilização da ANE. A primitiva computacional central da ANE foi identificada como convolução, e não multiplicação de matrizes, o que levou a melhorias significativas no throughput. Apesar de estar em estágios iniciais, o projeto é open source sob a licença MIT e ganhou atenção significativa, com cerca de 2.800 estrelas no GitHub em cinco dias.
Desenvolvedor Consegue Primeiro Treinamento de Rede Neural na Apple Neural Engine
Aviso Legal: O conteúdo disponibilizado no Phemex News é apenas para fins informativos. Não garantimos a qualidade, precisão ou integridade das informações provenientes de artigos de terceiros. Este conteúdo não constitui aconselhamento financeiro ou de investimento. Recomendamos fortemente que você realize suas próprias pesquisas e consulte um consultor financeiro qualificado antes de tomar decisões de investimento.
