Meituan dévoile le modèle LongCat-2.0 à 2 000 milliards de paramètres

Meituan a lancé son nouveau modèle à un trillion de paramètres, LongCat-2.0, qui sera open source, selon des rapports du 30 juin. Les données de pré-entraînement du modèle dépassent 30 trillions de tokens, englobant le chinois, l'anglais, plusieurs langues et du code. L'équipe LongCat a relevé les défis liés à la formation avec la puissance de calcul domestique, tels que les pannes matérielles et les anomalies de communication, en améliorant la stabilité, la précision et l'efficacité. Ils ont obtenu une réduction de 70 % des taux de défaillance mensuels grâce à la gestion des exceptions HCCL et à la récupération automatique des pannes. De plus, ils ont assuré la précision de l'entraînement avec des opérateurs déterministes et des vérifications des paramètres, tout en optimisant la précision des modules clés et la logique Reduce.

Source: Afficher l'original

Avertissement : Le contenu proposé sur Phemex News est à titre informatif uniquement. Nous ne garantissons pas la qualité, l'exactitude ou l'exhaustivité des informations provenant d'articles tiers. Ce contenu ne constitue pas un conseil financier ou d'investissement. Nous vous recommandons vivement d'effectuer vos propres recherches et de consulter un conseiller financier qualifié avant toute décision d'investissement.