개발자 Manjeet Singh는 Claude Opus와 함께 역공학을 통해 M4 칩의 Apple Neural Engine(ANE)에서 신경망 훈련을 성공적으로 수행했습니다. 이는 일반적으로 추론에 사용되는 ANE에서 훈련이 처음으로 달성된 사례입니다. Apple의 CoreML 프레임워크를 우회하여 팀은 40개 이상의 비공개 클래스를 IOKit 커널 드라이버에 직접 매핑함으로써 메모리 내 모델 컴파일을 가능하게 했으며, 이는 훈련에 중요한 단계입니다.
이 프로젝트는 단일 트랜스포머 레이어에 대한 훈련을 구현했으며, 1단계당 9.3ms의 속도와 11.2%의 ANE 활용도를 달성했습니다. ANE의 핵심 계산 원시 연산은 행렬 곱셈이 아닌 컨볼루션으로 밝혀져 처리량이 크게 향상되었습니다. 초기 단계임에도 불구하고 이 프로젝트는 MIT 라이선스 하에 오픈소스로 공개되었으며, 5일 만에 GitHub에서 약 2,800개의 스타를 받으며 큰 주목을 받고 있습니다.
개발자, 애플 뉴럴 엔진에서 최초로 신경망 훈련 성공
면책 조항: Phemex 뉴스에서 제공하는 콘텐츠는 정보 제공 목적으로만 제공됩니다. 제3자 기사에서 출처를 얻은 정보의 품질, 정확성 또는 완전성을 보장하지 않습니다.이 페이지의 콘텐츠는 재무 또는 투자 조언이 아닙니다.투자 결정을 내리기 전에 반드시 스스로 조사하고 자격을 갖춘 재무 전문가와 상담하시기 바랍니다.
