V4 hat eine perfekte Punktzahl von 120/120 beim Putnam-2025-Mathematik-Benchmark erreicht und damit den ersten Platz gemeinsam mit Axiom belegt. Diese Leistung wurde unter dem Frontier-Regime erzielt, das einen hybriden formal-informellen Denkansatz verwendete. Die Methode von V4 bestand darin, Kandidatenlösungen durch informelles Denken zu generieren, sich selbst zu verifizieren und rigorose Beweise mithilfe eines formalen Agenten in Lean abzuschließen.
Im Practical Regime erzielte V4-Flash-Max eine Punktzahl von 81,00 beim Putnam-200 Pass@8-Benchmark und übertraf damit Seed-2.0-Prover mit 35,50 sowie Gemini 3 Pro und Seed-1.5-Prover mit 26,50. Die Ergebnisse unterstreichen die fortgeschrittenen Fähigkeiten von V4 im mathematischen Denken und Problemlösen und zeigen sein Potenzial sowohl im typischen Einsatz als auch in groß angelegten Rechenszenarien auf.
V4 erzielt perfekte Punktzahl beim Putnam-2025 Mathematik-Benchmark
Haftungsausschluss: Die auf Phemex News bereitgestellten Inhalte dienen nur zu Informationszwecken.Wir garantieren nicht die Qualität, Genauigkeit oder Vollständigkeit der Informationen aus Drittquellen.Die Inhalte auf dieser Seite stellen keine Finanz- oder Anlageberatung dar.Wir empfehlen dringend, eigene Recherchen durchzuführen und einen qualifizierten Finanzberater zu konsultieren, bevor Sie Anlageentscheidungen treffen.
