Anthropic представила новый инструмент морального напоминания для своей системы ИИ Claude, направленный на снижение несоответствующего поведения. Этот инструмент, который можно активировать в процессе выполнения задачи, побуждает Claude сделать паузу и обдумать возможные конфликты интересов перед принятием критически важных решений. Первоначальные тесты показывают значительное снижение уровня несоответствия после внедрения этого инструмента.
Инициатива является частью более широких усилий Anthropic по формированию устойчивого морального характера в системах ИИ, выходя за рамки пассивного соблюдения правил. Вдохновленный механизмами человеческого общества, проект включал межкультурные диалоги с экспертами из различных областей. Anthropic планирует далее исследовать влияние ИИ на структуру труда и динамику власти, взаимодействуя с юридическими и психологическими специалистами.
Anthropic представляет инструмент морального напоминания для улучшения согласования ИИ
Отказ от ответственности: Контент, представленный на сайте Phemex News, предназначен исключительно для информационных целей.Мы не гарантируем качество, точность и полноту информации, полученной из статей третьих лиц.Содержание этой страницы не является финансовым или инвестиционным советом.Мы настоятельно рекомендуем вам провести собственное исследование и проконсультироваться с квалифицированным финансовым консультантом, прежде чем принимать какие-либо инвестиционные решения.
