BridgeMind AI : critiques sur la rétrogradation Claude Opus 4.6

La revendication virale de BridgeMind AI selon laquelle Claude Opus 4.6 d'Anthropic aurait été secrètement rétrogradé a suscité la controverse. Le post alléguait une chute significative des performances du modèle sur le benchmark BridgeBench hallucination, avec une précision passant de 83,3 % à 68,3 %. Cependant, des critiques, dont le scientifique informatique Paul Calcraft, ont rejeté cette affirmation comme étant erronée, notant que le nouveau test impliquait un ensemble différent de tâches, et que les performances sur les tâches communes ne montraient qu'une légère variation. Le débat met en lumière des frustrations plus larges concernant la baisse perçue de la qualité des modèles d'IA. Depuis son lancement, Claude Opus 4.6 a fait l'objet de plaintes concernant une réduction de la profondeur du raisonnement et des réponses plus courtes, en partie dues aux contrôles de pensée adaptative d'Anthropic. Ces changements privilégient l'efficacité au détriment de la profondeur, affectant les développeurs qui comptent sur une performance constante. Malgré la controverse, Anthropic n'a pas commenté ces affirmations spécifiques au 13 avril.