La revendication virale de BridgeMind AI selon laquelle Claude Opus 4.6 d'Anthropic aurait été secrètement rétrogradé a suscité la controverse. Le post alléguait une chute significative des performances du modèle sur le benchmark BridgeBench hallucination, avec une précision passant de 83,3 % à 68,3 %. Cependant, des critiques, dont le scientifique informatique Paul Calcraft, ont rejeté cette affirmation comme étant erronée, notant que le nouveau test impliquait un ensemble différent de tâches, et que les performances sur les tâches communes ne montraient qu'une légère variation.
Le débat met en lumière des frustrations plus larges concernant la baisse perçue de la qualité des modèles d'IA. Depuis son lancement, Claude Opus 4.6 a fait l'objet de plaintes concernant une réduction de la profondeur du raisonnement et des réponses plus courtes, en partie dues aux contrôles de pensée adaptative d'Anthropic. Ces changements privilégient l'efficacité au détriment de la profondeur, affectant les développeurs qui comptent sur une performance constante. Malgré la controverse, Anthropic n'a pas commenté ces affirmations spécifiques au 13 avril.
Les affirmations de BridgeMind AI sur la rétrogradation de Claude Opus 4.6 suscitent des critiques
Avertissement : Le contenu proposé sur Phemex News est à titre informatif uniquement. Nous ne garantissons pas la qualité, l'exactitude ou l'exhaustivité des informations provenant d'articles tiers. Ce contenu ne constitue pas un conseil financier ou d'investissement. Nous vous recommandons vivement d'effectuer vos propres recherches et de consulter un conseiller financier qualifié avant toute décision d'investissement.
