Nhóm LongCat của Meituan đã ra mắt LongCat-Flash-Prover, một mô hình với 560 tỷ tham số được thiết kế cho việc suy luận toán học trong Lean4. Mô hình này, được phát hành mã nguồn mở dưới giấy phép MIT, có sẵn trên GitHub, Hugging Face và ModelScope. Nó xuất sắc trong việc tự động hóa hình thức hóa, tạo phác thảo và tạo bằng chứng đầy đủ, đạt tỷ lệ vượt qua 97,1% trên MiniF2F-Test với 72 bước suy luận.
Mô hình sử dụng Khung Lặp Chuyên Gia Hỗn Hợp để đào tạo và thuật toán HisPO cho học tăng cường ổn định. Nó thiết lập các tiêu chuẩn mới trong tự động hóa hình thức hóa và chứng minh định lý, với các hiệu suất đáng chú ý trên ProverBench và PutnamBench, đạt tỷ lệ vượt qua lần lượt là 70,8% và 41,5%.
Meituan Ra Mắt Mô Hình Chứng Minh Định Lý Với 560 Tỷ Tham Số và Tỷ Lệ Đậu 97,1%
Tuyên bố miễn trừ trách nhiệm: Nội dung được cung cấp trên Phemex News chỉ nhằm mục đích cung cấp thông tin.Chúng tôi không đảm bảo chất lượng, độ chính xác hoặc tính đầy đủ của thông tin có nguồn từ các bài viết của bên thứ ba.Nội dung trên trang này không cấu thành lời khuyên về tài chính hoặc đầu tư.Chúng tôi đặc biệt khuyến khích bạn tự tiến hành nghiên cứu và tham khảo ý kiến của cố vấn tài chính đủ tiêu chuẩn trước khi đưa ra bất kỳ quyết định đầu tư nào.
