Cerebras, trilyon parametreli büyük modeli Kimi K2.6'yı kurumsal testlerde tanıttı ve uzun metin işleme görevlerinde önemli bir hız artışı gösterdi. 12 inçlik silikon bir plaka üzerinde çipleri entegre ederek, model bağlantı gecikmesini ortadan kaldırıyor ve saniyede 981 token üretim hızıyla, ana akım GPU bulut hizmetlerinden 6,7 kat daha hızlı performans sergiliyor.
10.000 giriş tokeni ve 500 çıkış tokeni içeren testlerde, Kimi K2.6 yanıt süresini 163,7 saniyeden sadece 5,6 saniyeye düşürerek 29 katlık bir iyileşme sağladı. Modelin mimarisi, plakanın üzerindeki çip ağı üzerinde katmanlar arası iletişime izin vererek NVIDIA'nın NVLink'inden 200 kat daha yüksek bant genişliği sunuyor. Bu, dağıtık hesaplama optimizasyonları ve verimli veri işleme ile birleştiğinde, minimum hassasiyet kaybıyla gerçek zamanlı performans sağlıyor.
Cerebras'ın Kimi K2.6 Modeli Uzun Metin Görevlerinde 29 Kat Hız Artışı Sağladı
Sorumluluk Reddi: Phemex Haberler'de sunulan içerik yalnızca bilgilendirme amaçlıdır. Üçüncü taraf makalelerden alınan bilgilerin kalitesi, doğruluğu veya eksiksizliğini garanti etmiyoruz. Bu sayfadaki içerik finansal veya yatırım tavsiyesi niteliği taşımaz. Yatırım kararları vermeden önce kendi araştırmanızı yapmanızı ve nitelikli bir finans danışmanına başvurmanızı şiddetle tavsiye ederiz.
