OpenAI, gerçek dünya bilimsel araştırma senaryolarında yapay zeka sistemlerinin yeteneklerini değerlendirmeyi amaçlayan yeni bir kıyaslama aracı olan LifeSciBench'i tanıttı. Bu kıyaslama aracı, biyoteknoloji veya ilaç alanında doktora derecesine sahip 173 araştırmacı tarafından hazırlanan yedi araştırma iş akışı kategorisi ve yedi biyoloji alanında toplam 750 görevden oluşmaktadır. LifeSciBench, kanıt entegrasyonu, deney tasarımı ve bilimsel akıl yürütme gibi karmaşık bilimsel yeteneklere odaklanmakta olup, görevlerin %79'undan fazlası çok adımlı akıl yürütme gerektirmekte ve her soru ortalama dört akıl yürütme adımı içermektedir. Kıyaslama aracı, pratik alaka düzeyini artıran 1.062 gerçek araştırma ile ilgili veri eki içermektedir.
OpenAI, Bilimsel Araştırmalarda Yapay Zekayı Değerlendirmek İçin LifeSciBench'i Başlattı
Sorumluluk Reddi: Phemex Haberler'de sunulan içerik yalnızca bilgilendirme amaçlıdır. Üçüncü taraf makalelerden alınan bilgilerin kalitesi, doğruluğu veya eksiksizliğini garanti etmiyoruz. Bu sayfadaki içerik finansal veya yatırım tavsiyesi niteliği taşımaz. Yatırım kararları vermeden önce kendi araştırmanızı yapmanızı ve nitelikli bir finans danışmanına başvurmanızı şiddetle tavsiye ederiz.
