Zhipu, saniyede 400 token gibi çığır açan bir çıktı hızı elde eden GLM-5.1 Yüksek Hızlı API'sini tanıttı ve bu, büyük model arayüzleri için yeni bir küresel standart oluşturdu. Seçili kurumsal müşterilere sunulan bu yüksek hızlı API, TileRT ekibi ile iş birliği içinde geliştirilen yüksek performanslı bir çıkarım motoru tarafından desteklenmektedir. Motor, modelleri kalıcı Motor Çekirdeklerine derleyerek GPU zamanlamasını optimize eder ve gecikmeyi önemli ölçüde azaltır.
Çoklu GPU ortamlarında, TileRT sistemi, 8-GPU NVL topolojisinde GPU düğümlerini uzmanlaştırarak verimliliği artırır, dikkat katmanı hesaplamalarını ve GPU'lar arası iletişimi geliştirir. Zhipu, FP8 çıkarımını daha da optimize etmeyi ve AI programlama ve gerçek zamanlı etkileşimler gibi düşük gecikmeli uygulamaları desteklemek için bağlam yeteneklerini genişletmeyi planlıyor.
Zhipu, Rekor 400 Token/s Çıktı ile GLM-5.1 API'sini Tanıttı
Sorumluluk Reddi: Phemex Haberler'de sunulan içerik yalnızca bilgilendirme amaçlıdır. Üçüncü taraf makalelerden alınan bilgilerin kalitesi, doğruluğu veya eksiksizliğini garanti etmiyoruz. Bu sayfadaki içerik finansal veya yatırım tavsiyesi niteliği taşımaz. Yatırım kararları vermeden önce kendi araştırmanızı yapmanızı ve nitelikli bir finans danışmanına başvurmanızı şiddetle tavsiye ederiz.
