Geliştirici Manjeet Singh, Claude Opus ile birlikte, tersine mühendislik yoluyla M4 çipindeki Apple'ın Neural Engine'inde (ANE) sinir ağı eğitimi yapmayı başardı. Bu, genellikle çıkarım için kullanılan ANE üzerinde ilk kez eğitim yapılması anlamına geliyor. Apple'ın CoreML çerçevesini atlayarak, ekip 40'tan fazla özel sınıfı doğrudan IOKit çekirdek sürücüsüne eşledi ve bu da eğitim için kritik bir adım olan modelin bellekte derlenmesini sağladı. Proje, tek bir transformer katmanı için eğitim uyguladı ve adım başına 9,3 ms ile %11,2 ANE kullanımı elde etti. ANE'nin temel hesaplama biriminin matris çarpımı değil, konvolüsyon olduğu tespit edildi ve bu da önemli ölçüde verim artışına yol açtı. Henüz erken aşamalarda olmasına rağmen, proje MIT lisansı altında açık kaynak olarak yayımlandı ve beş gün içinde GitHub'da yaklaşık 2.800 yıldız alarak büyük ilgi gördü.