El equipo LongCat de Meituan ha presentado LongCat-Flash-Prover, un modelo de 560 mil millones de parámetros diseñado para el razonamiento matemático en Lean4. El modelo, de código abierto bajo la licencia MIT, está disponible en GitHub, Hugging Face y ModelScope. Destaca en formalización automática, generación de esquemas y generación completa de pruebas, logrando una tasa de aprobación del 97.1% en MiniF2F-Test con 72 pasos de razonamiento. El modelo emplea el Marco de Iteración de Expertos Híbridos para el entrenamiento y el algoritmo HisPO para un aprendizaje por refuerzo estable. Establece nuevos estándares en formalización automatizada y demostración de teoremas, con actuaciones notables en ProverBench y PutnamBench, alcanzando tasas de aprobación del 70.8% y 41.5%, respectivamente.