MiniMax AI, 230 milyar parametreli modeli M2.7 için performans test sonuçlarını yayımladı ve farklı donanım konfigürasyonlarındaki çıkarım hızlarını gösterdi. Unsloth’un UD-IQ3_XXS (80GB) kuantize versiyonu kullanılarak, model dört adet RTX 4090 (96GB) GPU üzerinde saniyede 71,52 token (tok/s) çıkarım hızı ve ilk tokena ulaşma süresi (TTFT) olarak 1045 milisaniye elde etti. Performans, dört adet RTX 5090 (128GB) GPU üzerinde iyileşerek 120,54 tok/s hızına ve 725 ms TTFT değerine ulaştı. Ayrıca, tek bir RTX PRO 6000 (96GB) GPU 118,74 tok/s hız ve 765 ms TTFT kaydetti. DGX sistemlerinde de testler yapıldı ancak spesifik sonuçlar açıklanmadı.