開発者のManjeet SinghはClaude Opusと共に、リバースエンジニアリングを通じてM4チップ上のAppleのNeural Engine(ANE)でニューラルネットワークのトレーニングを成功させました。これは、通常推論に使用されるANEでトレーニングが達成された初めての事例です。AppleのCoreMLフレームワークをバイパスすることで、チームは40以上のプライベートクラスをIOKitカーネルドライバに直接マッピングし、メモリ内でのモデルコンパイルを可能にしました。これはトレーニングにおいて重要なステップです。 このプロジェクトでは単一のトランスフォーマーレイヤーのトレーニングを実装し、1ステップあたり9.3ms、ANE利用率11.2%を達成しました。ANEのコア計算プリミティブは行列乗算ではなく畳み込みであることが判明し、これによりスループットが大幅に向上しました。まだ初期段階であるにもかかわらず、このプロジェクトはMITライセンスの下でオープンソース化され、5日間で約2,800のスターをGitHub上で獲得し、大きな注目を集めています。