MeituanのLongCatチームは、Lean4での数学的推論を目的とした5600億パラメータのモデル「LongCat-Flash-Prover」を発表しました。このモデルはMITライセンスのもとでオープンソース化されており、GitHub、Hugging Face、ModelScopeで利用可能です。自動形式化、スケッチ生成、完全証明生成に優れており、MiniF2F-Testで72ステップの推論を経て97.1%の合格率を達成しています。
このモデルは、トレーニングにHybrid-Experts Iteration Frameworkを採用し、安定した強化学習のためにHisPOアルゴリズムを使用しています。自動形式化と定理証明において新たなベンチマークを打ち立てており、ProverBenchとPutnamBenchではそれぞれ70.8%と41.5%の合格率を記録しています。
美団、97.1%の合格率を誇る5600億パラメータの定理証明モデルを発表
免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。
