Grok 4.20 Beta erreicht 97 % beim τ²-Bench und sichert sich den zweiten Platz

Grok 4.20 Beta hat bei der τ²-Bench-Bewertung eine Genauigkeitsrate von 97 % erreicht und damit den zweiten Platz gesichert. Die τ²-Bench, eine Erweiterung des ursprünglichen τ-bench-Frameworks von Sierra, ist bekannt für ihre strengen Teststandards. Dieser Benchmark bewertet die Fähigkeiten von KI beim Beantworten von Fragen und beim Ausführen von Navigationsaufgaben und hebt die fortschrittliche Leistung von Grok 4.20 Beta in diesen Bereichen hervor.

Quelle: Original anzeigen

Haftungsausschluss: Die auf Phemex News bereitgestellten Inhalte dienen nur zu Informationszwecken.Wir garantieren nicht die Qualität, Genauigkeit oder Vollständigkeit der Informationen aus Drittquellen.Die Inhalte auf dieser Seite stellen keine Finanz- oder Anlageberatung dar.Wir empfehlen dringend, eigene Recherchen durchzuführen und einen qualifizierten Finanzberater zu konsultieren, bevor Sie Anlageentscheidungen treffen.