V4 đã đạt điểm tuyệt đối 120/120 trong kỳ thi chuẩn Putnam-2025 về toán học, đồng hạng nhất với Axiom. Thành tích này được thực hiện dưới Chế độ Frontier, sử dụng phương pháp kết hợp giữa lập luận chính thức và không chính thức. Phương pháp của V4 bao gồm việc tạo ra các giải pháp ứng viên thông qua lập luận không chính thức, tự xác minh và hoàn thành các bằng chứng nghiêm ngặt bằng cách sử dụng một tác nhân chính thức trong Lean. Trong Chế độ Thực tiễn, V4-Flash-Max đạt điểm 81.00 trong kỳ thi chuẩn Putnam-200 Pass@8, vượt trội so với 35.50 của Seed-2.0-Prover và 26.50 của Gemini 3 Pro và Seed-1.5-Prover. Kết quả này làm nổi bật khả năng tiên tiến của V4 trong lập luận toán học và giải quyết vấn đề, thể hiện tiềm năng của nó trong cả triển khai thông thường và các kịch bản tính toán quy mô lớn.