OpenAI представила LifeSciBench — новый эталонный тест, предназначенный для оценки возможностей ИИ-систем в реальных сценариях научных исследований. Тест включает 750 заданий, охватывающих семь категорий исследовательских рабочих процессов и семь областей биологии, разработанных 173 исследователями с докторскими степенями в области биотехнологий или фармацевтики. LifeSciBench сосредоточен на сложных научных навыках, таких как интеграция доказательств, проектирование экспериментов и научное рассуждение, при этом более 79% заданий требуют многоэтапного рассуждения, а в среднем на каждый вопрос приходится четыре шага рассуждения. В тест включено 1 062 реальных вложения с данными, связанными с исследованиями, что повышает его практическую значимость.
OpenAI запускает LifeSciBench для оценки ИИ в научных исследованиях
Отказ от ответственности: Контент, представленный на сайте Phemex News, предназначен исключительно для информационных целей.Мы не гарантируем качество, точность и полноту информации, полученной из статей третьих лиц.Содержание этой страницы не является финансовым или инвестиционным советом.Мы настоятельно рекомендуем вам провести собственное исследование и проконсультироваться с квалифицированным финансовым консультантом, прежде чем принимать какие-либо инвестиционные решения.
