Jan Leike, une figure éminente de la recherche sur l'alignement de l'IA, a rejoint Anthropic pour diriger son équipe de science de l'alignement. Leike, qui a quitté OpenAI en mai 2024 en invoquant des préoccupations de sécurité, mène désormais les efforts pour relever les défis complexes de la sécurité de l'IA chez Anthropic. Son équipe se concentre sur la supervision évolutive, la généralisation du faible au fort, la robustesse face aux jailbreaks et l'automatisation de la recherche sur l'alignement. Le transfert de Leike chez Anthropic, une entreprise fondée par d'anciens chercheurs d'OpenAI, souligne un engagement envers la sécurité de l'IA. Son travail influence le paysage plus large de la sécurité de l'IA, sa recherche façonnant les agendas industriels sur les techniques d'alignement.