A equipe LongCat da Meituan revelou o LongCat-Flash-Prover, um modelo com 560 bilhões de parâmetros projetado para raciocínio matemático em Lean4. O modelo, de código aberto sob a licença MIT, está disponível no GitHub, Hugging Face e ModelScope. Ele se destaca na formalização automática, geração de esboços e geração completa de provas, alcançando uma taxa de aprovação de 97,1% no MiniF2F-Test com 72 passos de raciocínio. O modelo utiliza o Hybrid-Experts Iteration Framework para treinamento e o algoritmo HisPO para aprendizado por reforço estável. Ele estabelece novos padrões em formalização automatizada e demonstração de teoremas, com desempenhos notáveis no ProverBench e PutnamBench, alcançando taxas de aprovação de 70,8% e 41,5%, respectivamente.