Zhipu AI, Kodlama Ajanı senaryolarında kullanılan GLM-5 serisi modellerinde iki kritik hatayı tespit edip çözdü. Mart ayından beri kullanıcılar tarafından bildirilen ve yüksek eşzamanlılık ile uzun bağlam uzunluklarında ortaya çıkan bu sorunlar, bozuk metin ve tekrarları içeriyordu. İlk hata, PD-ayırma mimarisinde bir yarış durumu ile ilgiliydi; burada bellek erken geri kazanıldı ve bu da veri üzerine yazmalara yol açtı. İkinci hata ise HiCache sisteminde bulundu; asenkron önbellek boşaltımı senkronizasyon eksikliği nedeniyle erken veri okumasına neden oluyordu. Yapılan düzeltmeler, anomali oranlarını önemli ölçüde azalttı ve bazı hataları ortadan kaldırdı. Ayrıca, Zhipu, spekülatif örnekleme için kabul oranı metriğinin anomali tespiti sinyali olarak kullanılabileceğini keşfetti; bu sayede sorunlar tespit edildiğinde gerçek zamanlı izleme ve otomatik yeniden denemeler mümkün hale geldi. LayerSplit KV Önbelleğinde yapılan ek optimizasyonlar, 40K ile 120K token uzunluğundaki isteklerde verimliliği %132'ye kadar artırarak, bağlam uzunluğu arttıkça performansı iyileştirdi.