PrismML, yüksek performansı korurken GPU bellek kullanımını 16-bit modelin dokuzda birine düşüren 1.58-bit üçlü ağırlık tekniğine sahip Ternary Bonsai dil modeli serisini piyasaya sürdü. 8 milyar, 4 milyar ve 1.7 milyar parametreli modelleri içeren bu seri, artık Hugging Face üzerinde açık kaynak olarak sunulmakta ve Apple cihazlarını yerel olarak desteklemektedir. 1.58-bit model, sinir ağı ağırlıklarını {-1, 0, +1} olmak üzere üç değerle sınırlandırarak gereksiz bağlantıları ortadan kaldırıp akıl yürütme yeteneklerini artırmaktadır. Ternary Bonsai 8B modeli, sadece 1.75 GB ağırlık dosyası boyutuyla ortalama 75.5 puanlık bir kıyaslama skoru elde ederek, 1-bit öncüsünü ve benzer yoğun modelleri zeka yoğunluğunda geride bırakmaktadır. Ayrıca enerji verimliliği ve çıkarım hızında da iyileşme sunmakta, iPhone 17 Pro Max üzerinde saniyede 27 token işleyerek 3 ila 4 kat daha iyi enerji verimliliği sağlamaktadır. Bu modeller Apache 2.0 lisansı altında dağıtılmakta olup, geliştiricilere uç cihazlar için yüksek performanslı yapay zeka çözümleri sunmaktadır.