Meituan, 30 Haziran tarihli haberlere göre, açık kaynak olarak sunulacak yeni trilyon parametreli modeli LongCat-2.0'ı piyasaya sürdü. Modelin ön eğitim verisi 30 trilyondan fazla token içeriyor ve Çince, İngilizce, birçok dil ve kodu kapsıyor. LongCat ekibi, donanım arızaları ve iletişim anormallikleri gibi yerel hesaplama gücü eğitimindeki zorlukları, kararlılık, doğruluk ve verimliliği artırarak ele aldı. HCCL istisna yönetimi ve otomatik hata kurtarma sayesinde aylık arıza oranlarını %70 azalttılar. Ayrıca, belirleyici operatörler ve parametre kontrolleri ile eğitim doğruluğunu sağlarken, ana modül hassasiyetini ve Reduce mantığını optimize ettiler.