Критика по снижению версии Claude Opus 4.6 от BridgeMind AI

Вирусное заявление BridgeMind AI о том, что Anthropic тайно понизила версию Claude Opus 4.6, вызвало споры. В посте утверждалось о значительном снижении производительности модели на тесте BridgeBench hallucination, где точность упала с 83,3% до 68,3%. Однако критики, включая компьютерного учёного Пола Калькрафта, отвергли это утверждение как ошибочное, отметив, что повторное тестирование проводилось на другом наборе задач, а результаты по пересекающимся задачам показали лишь незначительные отклонения. Дебаты подчёркивают более широкое недовольство по поводу предполагаемого снижения качества моделей ИИ. С момента запуска Claude Opus 4.6 поступали жалобы на уменьшение глубины рассуждений и сокращение длины ответов, отчасти из-за адаптивных контролей мышления Anthropic. Эти изменения делают приоритетом эффективность в ущерб глубине, что влияет на разработчиков, которые рассчитывают на стабильную производительность. Несмотря на спор, Anthropic по состоянию на 13 апреля не комментировала конкретные заявления.