V4, Putnam-2025 matematik kıyaslamasında 120/120 tam puan alarak Axiom ile birinciliği paylaştı. Bu başarı, hibrit formal-gayri resmi akıl yürütme yaklaşımı kullanan Frontier Rejimi altında elde edildi. V4'ün yöntemi, gayri resmi akıl yürütme yoluyla aday çözümler üretmeyi, kendi kendini doğrulamayı ve Lean'deki formal bir ajan kullanarak titiz kanıtları tamamlamayı içeriyordu. Pratik Rejimde, V4-Flash-Max Putnam-200 Pass@8 kıyaslamasında 81.00 puan alarak Seed-2.0-Prover'ın 35.50'si ile Gemini 3 Pro ve Seed-1.5-Prover'ın 26.50'sini geride bıraktı. Sonuçlar, V4'ün matematiksel akıl yürütme ve problem çözme konusundaki gelişmiş yeteneklerini vurgulayarak, hem tipik uygulamalarda hem de büyük ölçekli hesaplama senaryolarında potansiyelini gösteriyor.