GPT-5.5, ProgramBench Yarışmasında Mükemmel Puan Aldı

GPT-5.5, Meta FAIR, Stanford ve Harvard tarafından geliştirilen bir kıyaslama testi olan ProgramBench ikili yeniden yazma meydan okumasında mükemmel puan alan ilk yapay zeka oldu. Bu meydan okuma, yapay zekanın kaynak kodu veya ipuçları olmadan derlenmiş ikililerden programları yeniden oluşturmasını gerektiriyor. GPT-5.5, yüksek muhakeme modunda, cmatrix programını hem C hem de Python dillerinde başarıyla yeniden yaratarak tüm testleri sırasıyla 3,17$ ve 4,84$ maliyetle geçti. Buna karşılık, Claude Opus 4.7, daha yüksek maliyetlere ve API çağrılarına rağmen 19 testi geçemedi. Bu başarı, muhakeme yoğunluğunun yapay zeka performansı üzerindeki etkisini vurgularken, tam ikili anlayışın hala uzak bir hedef olduğunu gösteriyor.

Kaynak: Orijinalini Göster

Sorumluluk Reddi: Phemex Haberler'de sunulan içerik yalnızca bilgilendirme amaçlıdır. Üçüncü taraf makalelerden alınan bilgilerin kalitesi, doğruluğu veya eksiksizliğini garanti etmiyoruz. Bu sayfadaki içerik finansal veya yatırım tavsiyesi niteliği taşımaz. Yatırım kararları vermeden önce kendi araştırmanızı yapmanızı ve nitelikli bir finans danışmanına başvurmanızı şiddetle tavsiye ederiz.

​​Beğenebileceğiniz Diğer İçerikler​​

Beğenebileceğiniz Diğer İçerikler