Meituan a lancé son nouveau modèle à un trillion de paramètres, LongCat-2.0, qui sera open source, selon des rapports du 30 juin. Les données de pré-entraînement du modèle dépassent 30 trillions de tokens, englobant le chinois, l'anglais, plusieurs langues et du code. L'équipe LongCat a relevé les défis liés à la formation avec la puissance de calcul domestique, tels que les pannes matérielles et les anomalies de communication, en améliorant la stabilité, la précision et l'efficacité. Ils ont obtenu une réduction de 70 % des taux de défaillance mensuels grâce à la gestion des exceptions HCCL et à la récupération automatique des pannes. De plus, ils ont assuré la précision de l'entraînement avec des opérateurs déterministes et des vérifications des paramètres, tout en optimisant la précision des modules clés et la logique Reduce.