Anthropic Revela Novo Marco de Alinhamento de IA com a "Constituição Claude"

A Anthropic lançou uma versão atualizada de sua "Constituição Claude", um documento abrangente de 80 páginas que descreve a estrutura de alinhamento de IA da empresa. Esta nova constituição, disponível sob a licença Creative Commons CC0 1.0, foi projetada para servir como a "autoridade suprema" para o treinamento de modelos de IA. Seu objetivo é aprimorar a generalização da IA para novos cenários, explicando a lógica por trás de seus princípios, em vez de apenas listá-los. O documento prioriza a segurança ampla e a ética, a adesão às diretrizes e a assistência genuína. Inclui "restrições rígidas", como a proibição de assistência substancial no desenvolvimento de armas biológicas, e introduz capítulos sobre virtudes, segurança psicológica e autoconsciência do modelo. A Anthropic enfatiza a transparência e a iteração contínua em sua abordagem ao alinhamento de IA.

Fonte: Mostrar original

Aviso Legal: O conteúdo disponibilizado no Phemex News é apenas para fins informativos. Não garantimos a qualidade, precisão ou integridade das informações provenientes de artigos de terceiros. Este conteúdo não constitui aconselhamento financeiro ou de investimento. Recomendamos fortemente que você realize suas próprias pesquisas e consulte um consultor financeiro qualificado antes de tomar decisões de investimento.

Você também pode gostar