UnslothAI đã ra mắt phiên bản tối ưu MLX 4-bit của mô hình DGEMMA 4-31B, được thiết kế riêng cho Apple Silicon. Phiên bản mới này hứa hẹn tốc độ suy luận nhanh trên tất cả các máy Mac dòng M, sử dụng hiệu quả khoảng 20GB RAM. Mô hình được thiết kế để nâng cao hiệu suất đa phương thức và hình ảnh, hỗ trợ độ dài ngữ cảnh 256K và khả năng gọi hàm gốc.