Вирусное заявление BridgeMind AI о том, что Anthropic тайно понизила версию Claude Opus 4.6, вызвало споры. В посте утверждалось о значительном снижении производительности модели на тесте BridgeBench hallucination, где точность упала с 83,3% до 68,3%. Однако критики, включая компьютерного учёного Пола Калькрафта, отвергли это утверждение как ошибочное, отметив, что повторное тестирование проводилось на другом наборе задач, а результаты по пересекающимся задачам показали лишь незначительные отклонения.
Дебаты подчёркивают более широкое недовольство по поводу предполагаемого снижения качества моделей ИИ. С момента запуска Claude Opus 4.6 поступали жалобы на уменьшение глубины рассуждений и сокращение длины ответов, отчасти из-за адаптивных контролей мышления Anthropic. Эти изменения делают приоритетом эффективность в ущерб глубине, что влияет на разработчиков, которые рассчитывают на стабильную производительность. Несмотря на спор, Anthropic по состоянию на 13 апреля не комментировала конкретные заявления.
Заявления BridgeMind AI о понижении версии Claude Opus 4.6 подверглись критике
Отказ от ответственности: Контент, представленный на сайте Phemex News, предназначен исключительно для информационных целей.Мы не гарантируем качество, точность и полноту информации, полученной из статей третьих лиц.Содержание этой страницы не является финансовым или инвестиционным советом.Мы настоятельно рекомендуем вам провести собственное исследование и проконсультироваться с квалифицированным финансовым консультантом, прежде чем принимать какие-либо инвестиционные решения.
