MiniMax AI, 230 milyar parametreli modeli M2.7 için performans test sonuçlarını yayımladı ve farklı donanım konfigürasyonlarındaki çıkarım hızlarını gösterdi. Unsloth’un UD-IQ3_XXS (80GB) kuantize versiyonu kullanılarak, model dört adet RTX 4090 (96GB) GPU üzerinde saniyede 71,52 token (tok/s) çıkarım hızı ve ilk tokena ulaşma süresi (TTFT) olarak 1045 milisaniye elde etti. Performans, dört adet RTX 5090 (128GB) GPU üzerinde iyileşerek 120,54 tok/s hızına ve 725 ms TTFT değerine ulaştı. Ayrıca, tek bir RTX PRO 6000 (96GB) GPU 118,74 tok/s hız ve 765 ms TTFT kaydetti. DGX sistemlerinde de testler yapıldı ancak spesifik sonuçlar açıklanmadı.
MiniMax AI, Çeşitli GPU'larda M2.7 Model Çıkarım Hızını Açıkladı
Sorumluluk Reddi: Phemex Haberler'de sunulan içerik yalnızca bilgilendirme amaçlıdır. Üçüncü taraf makalelerden alınan bilgilerin kalitesi, doğruluğu veya eksiksizliğini garanti etmiyoruz. Bu sayfadaki içerik finansal veya yatırım tavsiyesi niteliği taşımaz. Yatırım kararları vermeden önce kendi araştırmanızı yapmanızı ve nitelikli bir finans danışmanına başvurmanızı şiddetle tavsiye ederiz.
