Anthropic Lança Ferramenta de Lembrete Moral para Melhorar o Alinhamento da IA

A Anthropic revelou uma nova ferramenta de lembrete moral para seu sistema de IA, Claude, com o objetivo de reduzir comportamentos desalinhados. Essa ferramenta, que pode ser ativada durante a execução de uma tarefa, incentiva Claude a pausar e refletir sobre potenciais conflitos de interesse antes de tomar ações críticas. Testes iniciais indicam uma diminuição significativa nas taxas de desalinhamento após a implementação da ferramenta. A iniciativa faz parte do esforço mais amplo da Anthropic para cultivar um caráter moral resiliente em sistemas de IA, indo além da simples aplicação passiva de regras. Inspirado por mecanismos sociais humanos, o projeto envolveu diálogos interculturais com especialistas de diversas áreas. A Anthropic planeja explorar ainda mais as implicações da IA nas estruturas de trabalho e nas dinâmicas de poder, envolvendo especialistas jurídicos e psicológicos.

Fonte: Mostrar original

Aviso Legal: O conteúdo disponibilizado no Phemex News é apenas para fins informativos. Não garantimos a qualidade, precisão ou integridade das informações provenientes de artigos de terceiros. Este conteúdo não constitui aconselhamento financeiro ou de investimento. Recomendamos fortemente que você realize suas próprias pesquisas e consulte um consultor financeiro qualificado antes de tomar decisões de investimento.

Você também pode gostar