Le développeur Manjeet Singh, en collaboration avec Claude Opus, a réussi à effectuer l'entraînement d'un réseau neuronal sur le Neural Engine (ANE) d'Apple, intégré à la puce M4, grâce à l'ingénierie inverse. C'est la première fois que l'entraînement est réalisé sur l'ANE, qui est généralement utilisé pour l'inférence. En contournant le framework CoreML d'Apple, l'équipe a directement mappé plus de 40 classes privées vers le pilote noyau IOKit, permettant la compilation du modèle en mémoire — une étape cruciale pour l'entraînement.
Le projet a mis en œuvre l'entraînement d'une seule couche de transformeur, atteignant 9,3 ms par étape avec une utilisation de l'ANE à 11,2 %. La primitive computationnelle principale de l'ANE s'est avérée être la convolution, et non la multiplication matricielle, ce qui a conduit à des améliorations significatives du débit. Bien que le projet soit encore à ses débuts, il est open source sous licence MIT et a attiré une attention considérable, avec environ 2 800 étoiles sur GitHub en cinq jours.
Un développeur réalise la première formation de réseau neuronal sur Apple Neural Engine
Avertissement : Le contenu proposé sur Phemex News est à titre informatif uniquement. Nous ne garantissons pas la qualité, l'exactitude ou l'exhaustivité des informations provenant d'articles tiers. Ce contenu ne constitue pas un conseil financier ou d'investissement. Nous vous recommandons vivement d'effectuer vos propres recherches et de consulter un conseiller financier qualifié avant toute décision d'investissement.
