V4, Putnam-2025 matematik kıyaslamasında 120/120 tam puan alarak Axiom ile birinciliği paylaştı. Bu başarı, hibrit formal-gayri resmi akıl yürütme yaklaşımı kullanan Frontier Rejimi altında elde edildi. V4'ün yöntemi, gayri resmi akıl yürütme yoluyla aday çözümler üretmeyi, kendi kendini doğrulamayı ve Lean'deki formal bir ajan kullanarak titiz kanıtları tamamlamayı içeriyordu.
Pratik Rejimde, V4-Flash-Max Putnam-200 Pass@8 kıyaslamasında 81.00 puan alarak Seed-2.0-Prover'ın 35.50'si ile Gemini 3 Pro ve Seed-1.5-Prover'ın 26.50'sini geride bıraktı. Sonuçlar, V4'ün matematiksel akıl yürütme ve problem çözme konusundaki gelişmiş yeteneklerini vurgulayarak, hem tipik uygulamalarda hem de büyük ölçekli hesaplama senaryolarında potansiyelini gösteriyor.
V4, Putnam-2025 Matematik Kıyaslamasında Mükemmel Puan Aldı
Sorumluluk Reddi: Phemex Haberler'de sunulan içerik yalnızca bilgilendirme amaçlıdır. Üçüncü taraf makalelerden alınan bilgilerin kalitesi, doğruluğu veya eksiksizliğini garanti etmiyoruz. Bu sayfadaki içerik finansal veya yatırım tavsiyesi niteliği taşımaz. Yatırım kararları vermeden önce kendi araştırmanızı yapmanızı ve nitelikli bir finans danışmanına başvurmanızı şiddetle tavsiye ederiz.
