Meituan'ın LongCat ekibi, Lean4'te matematiksel akıl yürütme için tasarlanmış 560 milyar parametreli LongCat-Flash-Prover modelini tanıttı. MIT lisansı altında açık kaynak olarak sunulan model, GitHub, Hugging Face ve ModelScope üzerinde erişilebilir durumda. Model, otomatik formalizasyon, taslak oluşturma ve tam kanıt üretiminde üstün performans göstererek MiniF2F-Test'te 72 akıl yürütme adımıyla %97,1 başarı oranı elde etti. Model, eğitim için Hybrid-Experts Iteration Framework'ü ve kararlı pekiştirmeli öğrenme için HisPO algoritmasını kullanıyor. Otomatik formalizasyon ve teorem ispatında yeni standartlar belirleyerek ProverBench ve PutnamBench'te sırasıyla %70,8 ve %41,5 başarı oranlarıyla dikkat çekici performanslar sergiledi.