Meituan'ın LongCat ekibi, Lean4'te matematiksel akıl yürütme için tasarlanmış 560 milyar parametreli LongCat-Flash-Prover modelini tanıttı. MIT lisansı altında açık kaynak olarak sunulan model, GitHub, Hugging Face ve ModelScope üzerinde erişilebilir durumda. Model, otomatik formalizasyon, taslak oluşturma ve tam kanıt üretiminde üstün performans göstererek MiniF2F-Test'te 72 akıl yürütme adımıyla %97,1 başarı oranı elde etti.
Model, eğitim için Hybrid-Experts Iteration Framework'ü ve kararlı pekiştirmeli öğrenme için HisPO algoritmasını kullanıyor. Otomatik formalizasyon ve teorem ispatında yeni standartlar belirleyerek ProverBench ve PutnamBench'te sırasıyla %70,8 ve %41,5 başarı oranlarıyla dikkat çekici performanslar sergiledi.
Meituan, %97,1 Başarı Oranına Sahip 560 Milyar Parametreli Teorem Kanıtlama Modelini Yayınladı
Sorumluluk Reddi: Phemex Haberler'de sunulan içerik yalnızca bilgilendirme amaçlıdır. Üçüncü taraf makalelerden alınan bilgilerin kalitesi, doğruluğu veya eksiksizliğini garanti etmiyoruz. Bu sayfadaki içerik finansal veya yatırım tavsiyesi niteliği taşımaz. Yatırım kararları vermeden önce kendi araştırmanızı yapmanızı ve nitelikli bir finans danışmanına başvurmanızı şiddetle tavsiye ederiz.
