Команда LongCat компании Meituan представила LongCat-Flash-Prover — модель с 560 миллиардами параметров, предназначенную для математических рассуждений в Lean4. Модель с открытым исходным кодом под лицензией MIT доступна на GitHub, Hugging Face и ModelScope. Она превосходно справляется с автоматической формализацией, генерацией эскизов и полной генерацией доказательств, достигая 97,1% успешных результатов на тесте MiniF2F-Test с 72 шагами рассуждений.
Модель использует гибридную итерационную структуру экспертов (Hybrid-Experts Iteration Framework) для обучения и алгоритм HisPO для стабильного обучения с подкреплением. Она устанавливает новые стандарты в автоматической формализации и доказательстве теорем, демонстрируя заметные результаты на ProverBench и PutnamBench с показателями успешности 70,8% и 41,5% соответственно.
Meituan выпустила модель доказательства теорем с 560 миллиардами параметров и уровнем прохождения 97,1%
Отказ от ответственности: Контент, представленный на сайте Phemex News, предназначен исключительно для информационных целей.Мы не гарантируем качество, точность и полноту информации, полученной из статей третьих лиц.Содержание этой страницы не является финансовым или инвестиционным советом.Мы настоятельно рекомендуем вам провести собственное исследование и проконсультироваться с квалифицированным финансовым консультантом, прежде чем принимать какие-либо инвестиционные решения.
