L'équipe LongCat de Meituan a dévoilé LongCat-Flash-Prover, un modèle de 560 milliards de paramètres conçu pour le raisonnement mathématique en Lean4. Ce modèle, open source sous licence MIT, est disponible sur GitHub, Hugging Face et ModelScope. Il excelle dans la formalisation automatique, la génération d'esquisses et la génération complète de preuves, atteignant un taux de réussite de 97,1 % sur le MiniF2F-Test avec 72 étapes de raisonnement.
Le modèle utilise le cadre d'itération Hybrid-Experts pour l'entraînement et l'algorithme HisPO pour un apprentissage par renforcement stable. Il établit de nouveaux standards en formalisation automatisée et en démonstration de théorèmes, avec des performances remarquables sur ProverBench et PutnamBench, atteignant respectivement des taux de réussite de 70,8 % et 41,5 %.
Meituan publie un modèle de démonstration de théorèmes à 560 milliards de paramètres avec un taux de réussite de 97,1 %
Avertissement : Le contenu proposé sur Phemex News est à titre informatif uniquement. Nous ne garantissons pas la qualité, l'exactitude ou l'exhaustivité des informations provenant d'articles tiers. Ce contenu ne constitue pas un conseil financier ou d'investissement. Nous vous recommandons vivement d'effectuer vos propres recherches et de consulter un conseiller financier qualifié avant toute décision d'investissement.
