Anthropic presenta un nuevo marco de alineación de IA con la "Constitución Claude"

Anthropic ha publicado una versión actualizada de su "Constitución Claude", un documento exhaustivo de 80 páginas que describe el marco de alineación de IA de la empresa. Esta nueva constitución, disponible bajo una licencia Creative Commons CC0 1.0, está diseñada para servir como la "autoridad suprema" para el entrenamiento de modelos de IA. Su objetivo es mejorar la generalización de la IA a nuevos escenarios explicando la lógica detrás de sus principios, en lugar de simplemente enumerarlos. El documento prioriza la seguridad y ética amplias, el cumplimiento de las directrices y la asistencia genuina. Incluye "restricciones estrictas", como la prohibición de asistencia sustancial en el desarrollo de armas biológicas, e introduce capítulos sobre virtudes, seguridad psicológica y autoconciencia del modelo. Anthropic enfatiza la transparencia y la iteración continua en su enfoque de alineación de IA.

Fuente: Mostrar original

Aviso legal: El contenido de Phemex News es únicamente informativo.No garantizamos la calidad, precisión ni integridad de la información procedente de artículos de terceros.El contenido de esta página no constituye asesoramiento financiero ni de inversión.Le recomendamos encarecidamente que realice su propia investigación y consulte con un asesor financiero cualificado antes de tomar cualquier decisión de inversión.