Nhà phát triển Manjeet Singh, cùng với Claude Opus, đã thành công trong việc huấn luyện mạng nơ-ron trên Bộ xử lý Thần kinh của Apple (ANE) trên chip M4 thông qua kỹ thuật đảo ngược. Đây là lần đầu tiên việc huấn luyện được thực hiện trên ANE, vốn thường được sử dụng cho việc suy luận. Bằng cách bỏ qua framework CoreML của Apple, nhóm đã trực tiếp ánh xạ hơn 40 lớp riêng tư tới trình điều khiển kernel IOKit, cho phép biên dịch mô hình trong bộ nhớ — một bước quan trọng cho việc huấn luyện. Dự án đã triển khai huấn luyện cho một lớp transformer đơn, đạt thời gian 9,3ms mỗi bước với mức sử dụng ANE là 11,2%. Nguyên thủy tính toán cốt lõi của ANE được xác định là phép tích chập, không phải phép nhân ma trận, dẫn đến cải thiện đáng kể về thông lượng. Mặc dù còn ở giai đoạn đầu, dự án đã được mở mã nguồn theo giấy phép MIT và thu hút sự chú ý lớn, với khoảng 2.800 sao trên GitHub chỉ trong năm ngày.