El equipo LongCat de Meituan ha presentado LongCat-Flash-Prover, un modelo de 560 mil millones de parámetros diseñado para el razonamiento matemático en Lean4. El modelo, de código abierto bajo la licencia MIT, está disponible en GitHub, Hugging Face y ModelScope. Destaca en formalización automática, generación de esquemas y generación completa de pruebas, logrando una tasa de aprobación del 97.1% en MiniF2F-Test con 72 pasos de razonamiento.
El modelo emplea el Marco de Iteración de Expertos Híbridos para el entrenamiento y el algoritmo HisPO para un aprendizaje por refuerzo estable. Establece nuevos estándares en formalización automatizada y demostración de teoremas, con actuaciones notables en ProverBench y PutnamBench, alcanzando tasas de aprobación del 70.8% y 41.5%, respectivamente.
Meituan lanza un modelo de demostración de teoremas con 560 mil millones de parámetros y una tasa de aprobación del 97,1 %
Aviso legal: El contenido de Phemex News es únicamente informativo.No garantizamos la calidad, precisión ni integridad de la información procedente de artículos de terceros.El contenido de esta página no constituye asesoramiento financiero ni de inversión.Le recomendamos encarecidamente que realice su propia investigación y consulte con un asesor financiero cualificado antes de tomar cualquier decisión de inversión.
