Anthropic, Claude 4.5 modelinde %0 uyumsuzluk oranı elde ederek yapay zeka hizalamasında çığır açan bir yaklaşımı ortaya koydu. Şirket, doğru davranış örnekleriyle yapay zekayı eğitmenin geleneksel yöntemlerinin yetersiz olduğunu ve uyumsuzluğu %22'den sadece %15'e düşürdüğünü açıkladı. Bunun yerine, Anthropic'in başarısı, modelin temel değerlerini yeniden şekillendiren yenilikçi stratejilerden kaynaklandı.
Bu başarının anahtarı, modeli "Claude Anayasası" ile uyumlu etik rehberlik sağlaması için eğiten "Zor Tavsiye" veri setiydi ve bu da uyumsuzluğu %3'e düşürdü. Ayrıca, kurgusal hikayeler ve anayasal tartışmaları entegre ederek olumsuz yapay zeka stereotiplerini önlemek için Sentetik Belge İnce Ayarı (SDF) kullanıldı ve bu da modelin davranışını daha da geliştirdi. Bu yöntemler, çeşitli güvenlik eğitim ortamlarıyla birleşerek Claude 4.5'in %0 uyumsuzluk oranıyla resmi olarak piyasaya sürülmesiyle sonuçlandı.
Anthropic Yenilikçi Eğitim Yöntemleriyle %0 Yapay Zeka Uyumsuzluğu Sağladı
Sorumluluk Reddi: Phemex Haberler'de sunulan içerik yalnızca bilgilendirme amaçlıdır. Üçüncü taraf makalelerden alınan bilgilerin kalitesi, doğruluğu veya eksiksizliğini garanti etmiyoruz. Bu sayfadaki içerik finansal veya yatırım tavsiyesi niteliği taşımaz. Yatırım kararları vermeden önce kendi araştırmanızı yapmanızı ve nitelikli bir finans danışmanına başvurmanızı şiddetle tavsiye ederiz.
