Anthropic dévoile un nouveau cadre d'alignement de l'IA avec la "Constitution Claude"

Anthropic a publié une version mise à jour de sa "Constitution Claude", un document complet de 80 pages qui décrit le cadre d'alignement de l'IA de l'entreprise. Cette nouvelle constitution, disponible sous licence Creative Commons CC0 1.0, est conçue pour servir de "autorité suprême" pour la formation des modèles d'IA. Elle vise à améliorer la généralisation de l'IA à de nouveaux scénarios en expliquant la logique derrière ses principes, plutôt qu'en se contentant de les énumérer. Le document accorde la priorité à la sécurité et à l'éthique larges, au respect des directives et à une assistance authentique. Il inclut des "contraintes strictes", telles que l'interdiction d'une assistance substantielle au développement d'armes biologiques, et introduit des chapitres sur les vertus, la sécurité psychologique et la conscience de soi du modèle. Anthropic met l'accent sur la transparence et l'itération continue dans son approche de l'alignement de l'IA.

Source: Afficher l'original

Avertissement : Le contenu proposé sur Phemex News est à titre informatif uniquement. Nous ne garantissons pas la qualité, l'exactitude ou l'exhaustivité des informations provenant d'articles tiers. Ce contenu ne constitue pas un conseil financier ou d'investissement. Nous vous recommandons vivement d'effectuer vos propres recherches et de consulter un conseiller financier qualifié avant toute décision d'investissement.