UnslothAI ha lanzado una versión optimizada en 4 bits MLX de su modelo DGEMMA 4-31B, diseñada específicamente para Apple Silicon. Esta nueva versión promete velocidades rápidas de inferencia en todos los Macs de la serie M, utilizando alrededor de 20 GB de RAM de manera eficiente. El modelo está diseñado para mejorar el rendimiento multimodal y visual, soportando una longitud de contexto de 256K y capacidades nativas de llamada a funciones.