Das LongCat-Team von Meituan hat LongCat-Flash-Prover vorgestellt, ein Modell mit 560 Milliarden Parametern, das für mathematisches Schließen in Lean4 entwickelt wurde. Das Modell, das unter der MIT-Lizenz als Open Source verfügbar ist, kann auf GitHub, Hugging Face und ModelScope abgerufen werden. Es zeichnet sich durch automatische Formalisierung, Skizzenerstellung und vollständige Beweiserstellung aus und erreicht eine Erfolgsquote von 97,1 % im MiniF2F-Test mit 72 Schlussfolgerungsschritten. Das Modell verwendet das Hybrid-Experts Iteration Framework für das Training und den HisPO-Algorithmus für stabiles Reinforcement Learning. Es setzt neue Maßstäbe in der automatisierten Formalisierung und Theorembeweisführung und erzielt bemerkenswerte Leistungen bei ProverBench und PutnamBench mit Erfolgsquoten von 70,8 % bzw. 41,5 %.