Die virale Behauptung von BridgeMind AI, dass Anthropics Claude Opus 4.6 heimlich herabgestuft wurde, hat Kontroversen ausgelöst. Der Beitrag behauptete einen erheblichen Leistungsabfall des Modells beim BridgeBench-Halluzinationsbenchmark, wobei die Genauigkeit von 83,3 % auf 68,3 % sank. Kritiker, darunter der Informatiker Paul Calcraft, wiesen die Behauptung jedoch als fehlerhaft zurück und bemerkten, dass der Retest eine andere Aufgabenstellung beinhaltete und die Leistung bei überlappenden Aufgaben nur eine geringe Abweichung zeigte. Die Debatte verdeutlicht die breiteren Frustrationen über den wahrgenommenen Qualitätsrückgang von KI-Modellen. Seit seiner Einführung sieht sich Claude Opus 4.6 Beschwerden über eine geringere Tiefe des Denkens und kürzere Antworten ausgesetzt, teilweise aufgrund von Anthropics adaptiven Denksteuerungen. Diese Änderungen priorisieren Effizienz über Tiefe, was Entwickler betrifft, die auf konsistente Leistung angewiesen sind. Trotz der Kontroverse hat Anthropics bis zum 13. April keine Stellung zu den spezifischen Behauptungen genommen.