Cerebras, trilyon parametreli büyük modeli Kimi K2.6'yı kurumsal testlerde tanıttı ve uzun metin işleme görevlerinde önemli bir hız artışı gösterdi. 12 inçlik silikon bir plaka üzerinde çipleri entegre ederek, model bağlantı gecikmesini ortadan kaldırıyor ve saniyede 981 token üretim hızıyla, ana akım GPU bulut hizmetlerinden 6,7 kat daha hızlı performans sergiliyor. 10.000 giriş tokeni ve 500 çıkış tokeni içeren testlerde, Kimi K2.6 yanıt süresini 163,7 saniyeden sadece 5,6 saniyeye düşürerek 29 katlık bir iyileşme sağladı. Modelin mimarisi, plakanın üzerindeki çip ağı üzerinde katmanlar arası iletişime izin vererek NVIDIA'nın NVLink'inden 200 kat daha yüksek bant genişliği sunuyor. Bu, dağıtık hesaplama optimizasyonları ve verimli veri işleme ile birleştiğinde, minimum hassasiyet kaybıyla gerçek zamanlı performans sağlıyor.