Der Entwickler Manjeet Singh hat zusammen mit Claude Opus erfolgreich ein Training von neuronalen Netzwerken auf Apples Neural Engine (ANE) des M4-Chips durch Reverse Engineering durchgeführt. Dies ist das erste Mal, dass ein Training auf der ANE erreicht wurde, die normalerweise für Inferenz verwendet wird. Durch das Umgehen des CoreML-Frameworks von Apple hat das Team über 40 private Klassen direkt auf den IOKit-Kernel-Treiber abgebildet, was die Kompilierung von Modellen im Speicher ermöglicht – ein entscheidender Schritt für das Training. Das Projekt implementierte das Training für eine einzelne Transformer-Schicht und erreichte 9,3 ms pro Schritt bei einer ANE-Auslastung von 11,2 %. Die grundlegende Rechenoperation der ANE wurde als Faltung und nicht als Matrixmultiplikation identifiziert, was zu erheblichen Durchsatzverbesserungen führte. Obwohl sich das Projekt noch in einem frühen Stadium befindet, ist es unter der MIT-Lizenz als Open Source verfügbar und hat in fünf Tagen rund 2.800 Sterne auf GitHub erhalten.