메이투안의 롱캣(LongCat) 팀이 Lean4에서 수학적 추론을 위해 설계된 5600억 매개변수 모델인 롱캣-플래시-프로버(LongCat-Flash-Prover)를 공개했습니다. 이 모델은 MIT 라이선스 하에 오픈소스로 제공되며, GitHub, Hugging Face, ModelScope에서 이용할 수 있습니다. 자동 형식화, 스케치 생성, 완전 증명 생성에서 뛰어난 성능을 보이며, 72단계 추론으로 MiniF2F-Test에서 97.1%의 합격률을 기록했습니다. 이 모델은 훈련에 하이브리드-전문가 반복 프레임워크(Hybrid-Experts Iteration Framework)를 사용하고, 안정적인 강화 학습을 위해 HisPO 알고리즘을 적용합니다. 자동 형식화와 정리 증명 분야에서 새로운 기준을 세웠으며, ProverBench와 PutnamBench에서 각각 70.8%와 41.5%의 합격률을 달성하는 뛰어난 성과를 보였습니다.