Anthropic ha publicado una versión actualizada de su "Constitución Claude", un documento exhaustivo de 80 páginas que describe el marco de alineación de IA de la empresa. Esta nueva constitución, disponible bajo una licencia Creative Commons CC0 1.0, está diseñada para servir como la "autoridad suprema" para el entrenamiento de modelos de IA. Su objetivo es mejorar la generalización de la IA a nuevos escenarios explicando la lógica detrás de sus principios, en lugar de simplemente enumerarlos. El documento prioriza la seguridad y ética amplias, el cumplimiento de las directrices y la asistencia genuina. Incluye "restricciones estrictas", como la prohibición de asistencia sustancial en el desarrollo de armas biológicas, e introduce capítulos sobre virtudes, seguridad psicológica y autoconciencia del modelo. Anthropic enfatiza la transparencia y la iteración continua en su enfoque de alineación de IA.