GPT-5.5 erzielt perfekte Punktzahl bei ProgramBench-Herausforderung

GPT-5.5 ist die erste KI, die eine perfekte Punktzahl bei der ProgramBench-Binärumschreibungs-Herausforderung erzielt hat, einem Benchmark, der von Meta FAIR, Stanford und Harvard entwickelt wurde. Diese Herausforderung verlangt von der KI, Programme aus kompilierten Binärdateien ohne Quellcode oder Hinweise zu rekonstruieren. GPT-5.5 hat im High-Reasoning-Modus erfolgreich das Programm cmatrix sowohl in C als auch in Python nachgebildet und alle Tests bestanden, wobei die Kosten jeweils 3,17 $ bzw. 4,84 $ betrugen. Im Gegensatz dazu fiel Claude Opus 4.7 bei 19 Tests durch, trotz höherer Kosten und API-Aufrufe. Diese Leistung unterstreicht den Einfluss der Intensität des Denkprozesses auf die Leistung der KI, obwohl ein vollständiges Verständnis von Binärdateien noch ein fernes Ziel bleibt.

Quelle: Original anzeigen

Haftungsausschluss: Die auf Phemex News bereitgestellten Inhalte dienen nur zu Informationszwecken.Wir garantieren nicht die Qualität, Genauigkeit oder Vollständigkeit der Informationen aus Drittquellen.Die Inhalte auf dieser Seite stellen keine Finanz- oder Anlageberatung dar.Wir empfehlen dringend, eigene Recherchen durchzuführen und einen qualifizierten Finanzberater zu konsultieren, bevor Sie Anlageentscheidungen treffen.

Das könnte Ihnen auch gefallen