Разработчик Манджит Сингх совместно с Claude Opus успешно провели обучение нейронной сети на Apple Neural Engine (ANE) на чипе M4 с помощью обратного инжиниринга. Это первый случай, когда обучение было достигнуто на ANE, который обычно используется для инференса. Обойдя фреймворк CoreML от Apple, команда напрямую сопоставила более 40 приватных классов с драйвером ядра IOKit, что позволило компилировать модель в памяти — важный шаг для обучения.
В проекте реализовано обучение одного слоя трансформера, достигнуто время 9,3 мс на шаг при использовании ANE на 11,2%. Основным вычислительным примитивом ANE оказался свёрточный оператор, а не умножение матриц, что привело к значительному увеличению пропускной способности. Несмотря на раннюю стадию разработки, проект открыт под лицензией MIT и привлёк значительное внимание, набрав около 2800 звёзд на GitHub за пять дней.
Разработчик впервые обучил нейронную сеть на Apple Neural Engine
Отказ от ответственности: Контент, представленный на сайте Phemex News, предназначен исключительно для информационных целей.Мы не гарантируем качество, точность и полноту информации, полученной из статей третьих лиц.Содержание этой страницы не является финансовым или инвестиционным советом.Мы настоятельно рекомендуем вам провести собственное исследование и проконсультироваться с квалифицированным финансовым консультантом, прежде чем принимать какие-либо инвестиционные решения.
