Ян Лейке в Anthropic — руководитель исследований ИИ-безопасности

Ян Лейке, видный специалист в области исследований по согласованию ИИ, присоединился к компании Anthropic, чтобы возглавить команду по науке о согласовании. Лейке, который покинул OpenAI в мае 2024 года, ссылаясь на опасения по поводу безопасности, теперь возглавляет усилия по решению сложных задач безопасности ИИ в Anthropic. Его команда сосредоточена на масштабируемом контроле, переходе от слабой к сильной генерализации, устойчивости к обходам ограничений и автоматизации исследований по согласованию. Переход Лейке в Anthropic, компанию, основанную бывшими исследователями OpenAI, подчеркивает приверженность безопасности ИИ. Его работа оказывает влияние на более широкую сферу безопасности ИИ, формируя отраслевые повестки по методам согласования.