브리지마인드 AI 클로드 오퍼스 4.6 다운그레이드 논란

브리지마인드 AI가 앤트로픽의 클로드 오퍼스 4.6이 비밀리에 성능이 하향 조정되었다고 주장하며 논란이 일고 있다. 해당 게시물은 브리지벤치 환각 벤치마크에서 모델의 성능이 83.3%에서 68.3%로 크게 떨어졌다고 주장했다. 그러나 컴퓨터 과학자 폴 칼크래프트를 포함한 비평가들은 재검사가 다른 작업 세트로 이루어졌으며, 겹치는 작업에서의 성능 차이는 미미하다고 지적하며 이 주장을 결함이 있다고 일축했다. 이번 논쟁은 AI 모델의 품질 저하에 대한 더 넓은 불만을 드러낸다. 클로드 오퍼스 4.6은 출시 이후 추론 깊이 감소와 응답 길이 단축에 대한 불만을 받아왔으며, 이는 부분적으로 앤트로픽의 적응형 사고 제어 때문인 것으로 보인다. 이러한 변화는 깊이보다는 효율성을 우선시하여 일관된 성능에 의존하는 개발자들에게 영향을 미치고 있다. 논란에도 불구하고 앤트로픽은 4월 13일 현재 해당 주장에 대해 별다른 입장을 밝히지 않았다.