UnslothAI a lancé une version optimisée MLX en 4 bits de son modèle DGEMMA 4-31B, spécialement conçue pour Apple Silicon. Cette nouvelle version promet des vitesses d'inférence rapides sur tous les Mac de la série M, en utilisant efficacement environ 20 Go de RAM. Le modèle est conçu pour améliorer les performances multimodales et visuelles, prenant en charge une longueur de contexte de 256K ainsi que des capacités natives d'appel de fonctions.