Jan Leike, một nhân vật nổi bật trong nghiên cứu về sự phù hợp của AI, đã gia nhập Anthropic để dẫn dắt đội ngũ Khoa học Phù hợp của công ty. Leike, người đã rời OpenAI vào tháng 5 năm 2024 với lý do lo ngại về an toàn, hiện đang dẫn đầu các nỗ lực giải quyết những thách thức phức tạp về an toàn AI tại Anthropic. Đội ngũ của ông tập trung vào giám sát có thể mở rộng, tổng quát hóa từ yếu đến mạnh, khả năng chống lại các cuộc tấn công jailbreak, và tự động hóa nghiên cứu về sự phù hợp. Việc Leike chuyển đến Anthropic, một công ty được thành lập bởi các nhà nghiên cứu từng làm việc tại OpenAI, nhấn mạnh cam kết đối với an toàn AI. Công việc của ông đang ảnh hưởng đến bối cảnh an toàn AI rộng lớn hơn, với nghiên cứu của ông định hình các chương trình nghị sự trong ngành về các kỹ thuật phù hợp.