BridgeMind AI'nin Anthropic'in Claude Opus 4.6 modelinin gizlice düşürüldüğüne dair viral iddiası tartışmalara yol açtı. Paylaşımda, modelin BridgeBench halüsinasyon kıyaslama testindeki performansında önemli bir düşüş olduğu, doğruluk oranının %83,3'ten %68,3'e gerilediği ileri sürüldü. Ancak bilgisayar bilimcisi Paul Calcraft dahil eleştirmenler, yeniden testin farklı bir görev setiyle yapıldığını ve örtüşen görevlerde performansın sadece küçük bir farklılık gösterdiğini belirterek iddiayı hatalı buldu.
Bu tartışma, yapay zeka modellerinin algılanan kalite düşüşüne yönelik daha geniş bir memnuniyetsizliği ortaya koyuyor. Claude Opus 4.6, piyasaya sürülmesinden bu yana, kısmen Anthropic'in uyarlanabilir düşünme kontrolleri nedeniyle azalan muhakeme derinliği ve daha kısa yanıtlar hakkında şikayetlerle karşılaştı. Bu değişiklikler, derinlikten çok verimliliği önceliklendiriyor ve tutarlı performansa güvenen geliştiricileri etkiliyor. Tartışmalara rağmen, Anthropic 13 Nisan itibarıyla bu özel iddialar hakkında yorum yapmadı.
BridgeMind AI'nin Claude Opus 4.6 Düşürme İddiaları Eleştiriyle Karşılaştı
Sorumluluk Reddi: Phemex Haberler'de sunulan içerik yalnızca bilgilendirme amaçlıdır. Üçüncü taraf makalelerden alınan bilgilerin kalitesi, doğruluğu veya eksiksizliğini garanti etmiyoruz. Bu sayfadaki içerik finansal veya yatırım tavsiyesi niteliği taşımaz. Yatırım kararları vermeden önce kendi araştırmanızı yapmanızı ve nitelikli bir finans danışmanına başvurmanızı şiddetle tavsiye ederiz.
