UnslothAI hat eine 4-Bit MLX-optimierte Version seines DGEMMA 4-31B Modells vorgestellt, die speziell für Apple Silicon entwickelt wurde. Diese neue Version verspricht schnelle Inferenzgeschwindigkeiten auf allen Macs der M-Serie und nutzt dabei effizient etwa 20 GB RAM. Das Modell ist darauf ausgelegt, die multimodale und visuelle Leistung zu verbessern und unterstützt eine Kontextlänge von 256K sowie native Funktionsaufrufe.