OpenAI startet LifeSciBench zur Bewertung von KI in der wissenschaftlichen Forschung

OpenAI hat LifeSciBench vorgestellt, einen neuen Benchmark, der darauf abzielt, die Fähigkeiten von KI-Systemen in realen wissenschaftlichen Forschungsszenarien zu bewerten. Der Benchmark umfasst 750 Aufgaben in sieben Kategorien von Forschungsabläufen und sieben Biologiebereichen, die von 173 Forschern mit Doktortiteln in Biotechnologie oder Pharmazie erstellt wurden. LifeSciBench konzentriert sich auf komplexe wissenschaftliche Fähigkeiten wie Evidenzintegration, Versuchsplanung und wissenschaftliches Denken, wobei über 79 % der Aufgaben mehrstufiges Denken erfordern und durchschnittlich vier Denkschritte pro Frage notwendig sind. Der Benchmark enthält 1.062 echte, forschungsbezogene Datenanhänge, die seine praktische Relevanz erhöhen.

Quelle: Original anzeigen

Haftungsausschluss: Die auf Phemex News bereitgestellten Inhalte dienen nur zu Informationszwecken.Wir garantieren nicht die Qualität, Genauigkeit oder Vollständigkeit der Informationen aus Drittquellen.Die Inhalte auf dieser Seite stellen keine Finanz- oder Anlageberatung dar.Wir empfehlen dringend, eigene Recherchen durchzuführen und einen qualifizierten Finanzberater zu konsultieren, bevor Sie Anlageentscheidungen treffen.