Le développeur Manjeet Singh, en collaboration avec Claude Opus, a réussi à effectuer l'entraînement d'un réseau neuronal sur le Neural Engine (ANE) d'Apple, intégré à la puce M4, grâce à l'ingénierie inverse. C'est la première fois que l'entraînement est réalisé sur l'ANE, qui est généralement utilisé pour l'inférence. En contournant le framework CoreML d'Apple, l'équipe a directement mappé plus de 40 classes privées vers le pilote noyau IOKit, permettant la compilation du modèle en mémoire — une étape cruciale pour l'entraînement. Le projet a mis en œuvre l'entraînement d'une seule couche de transformeur, atteignant 9,3 ms par étape avec une utilisation de l'ANE à 11,2 %. La primitive computationnelle principale de l'ANE s'est avérée être la convolution, et non la multiplication matricielle, ce qui a conduit à des améliorations significatives du débit. Bien que le projet soit encore à ses débuts, il est open source sous licence MIT et a attiré une attention considérable, avec environ 2 800 étoiles sur GitHub en cinq jours.