BridgeMind AI Claude Opus 4.6 Düşürme İddiaları Eleştirildi

BridgeMind AI'nin Anthropic'in Claude Opus 4.6 modelinin gizlice düşürüldüğüne dair viral iddiası tartışmalara yol açtı. Paylaşımda, modelin BridgeBench halüsinasyon kıyaslama testindeki performansında önemli bir düşüş olduğu, doğruluk oranının %83,3'ten %68,3'e gerilediği ileri sürüldü. Ancak bilgisayar bilimcisi Paul Calcraft dahil eleştirmenler, yeniden testin farklı bir görev setiyle yapıldığını ve örtüşen görevlerde performansın sadece küçük bir farklılık gösterdiğini belirterek iddiayı hatalı buldu. Bu tartışma, yapay zeka modellerinin algılanan kalite düşüşüne yönelik daha geniş bir memnuniyetsizliği ortaya koyuyor. Claude Opus 4.6, piyasaya sürülmesinden bu yana, kısmen Anthropic'in uyarlanabilir düşünme kontrolleri nedeniyle azalan muhakeme derinliği ve daha kısa yanıtlar hakkında şikayetlerle karşılaştı. Bu değişiklikler, derinlikten çok verimliliği önceliklendiriyor ve tutarlı performansa güvenen geliştiricileri etkiliyor. Tartışmalara rağmen, Anthropic 13 Nisan itibarıyla bu özel iddialar hakkında yorum yapmadı.