A equipe LongCat da Meituan revelou o LongCat-Flash-Prover, um modelo com 560 bilhões de parâmetros projetado para raciocínio matemático em Lean4. O modelo, de código aberto sob a licença MIT, está disponível no GitHub, Hugging Face e ModelScope. Ele se destaca na formalização automática, geração de esboços e geração completa de provas, alcançando uma taxa de aprovação de 97,1% no MiniF2F-Test com 72 passos de raciocínio.
O modelo utiliza o Hybrid-Experts Iteration Framework para treinamento e o algoritmo HisPO para aprendizado por reforço estável. Ele estabelece novos padrões em formalização automatizada e demonstração de teoremas, com desempenhos notáveis no ProverBench e PutnamBench, alcançando taxas de aprovação de 70,8% e 41,5%, respectivamente.
Meituan Lança Modelo de Demonstração de Teoremas com 560 Bilhões de Parâmetros e Taxa de Aprovação de 97,1%
Aviso Legal: O conteúdo disponibilizado no Phemex News é apenas para fins informativos. Não garantimos a qualidade, precisão ou integridade das informações provenientes de artigos de terceiros. Este conteúdo não constitui aconselhamento financeiro ou de investimento. Recomendamos fortemente que você realize suas próprias pesquisas e consulte um consultor financeiro qualificado antes de tomar decisões de investimento.
