El desarrollador Manjeet Singh, junto con Claude Opus, ha logrado realizar con éxito el entrenamiento de redes neuronales en el Neural Engine (ANE) de Apple en el chip M4 mediante ingeniería inversa. Esta es la primera vez que se consigue entrenamiento en el ANE, que normalmente se utiliza para inferencia. Al evitar el framework CoreML de Apple, el equipo mapeó directamente más de 40 clases privadas al controlador del kernel IOKit, permitiendo la compilación del modelo en memoria, un paso crucial para el entrenamiento. El proyecto implementó el entrenamiento para una sola capa de transformador, logrando 9.3 ms por paso con un uso del 11.2% del ANE. Se descubrió que la operación computacional principal del ANE es la convolución, no la multiplicación de matrices, lo que llevó a mejoras significativas en el rendimiento. A pesar de estar en etapas iniciales, el proyecto es de código abierto bajo la licencia MIT y ha ganado una atención considerable, con alrededor de 2,800 estrellas en GitHub en cinco días.