A Anthropic lançou uma versão atualizada de sua "Constituição Claude", um documento abrangente de 80 páginas que descreve a estrutura de alinhamento de IA da empresa. Esta nova constituição, disponível sob a licença Creative Commons CC0 1.0, foi projetada para servir como a "autoridade suprema" para o treinamento de modelos de IA. Seu objetivo é aprimorar a generalização da IA para novos cenários, explicando a lógica por trás de seus princípios, em vez de apenas listá-los. O documento prioriza a segurança ampla e a ética, a adesão às diretrizes e a assistência genuína. Inclui "restrições rígidas", como a proibição de assistência substancial no desenvolvimento de armas biológicas, e introduz capítulos sobre virtudes, segurança psicológica e autoconsciência do modelo. A Anthropic enfatiza a transparência e a iteração contínua em sua abordagem ao alinhamento de IA.