MeituanのLongCatチームは、Lean4での数学的推論を目的とした5600億パラメータのモデル「LongCat-Flash-Prover」を発表しました。このモデルはMITライセンスのもとでオープンソース化されており、GitHub、Hugging Face、ModelScopeで利用可能です。自動形式化、スケッチ生成、完全証明生成に優れており、MiniF2F-Testで72ステップの推論を経て97.1%の合格率を達成しています。 このモデルは、トレーニングにHybrid-Experts Iteration Frameworkを採用し、安定した強化学習のためにHisPOアルゴリズムを使用しています。自動形式化と定理証明において新たなベンチマークを打ち立てており、ProverBenchとPutnamBenchではそれぞれ70.8%と41.5%の合格率を記録しています。