OpenAI는 텍스트 내 개인 식별 정보(PII)를 감지하고 편집하도록 설계된 오픈 소스 모델인 OpenAI Privacy Filter를 공개했습니다. 이 모델은 총 15억 개의 파라미터와 5천만 개의 활성 파라미터를 특징으로 하며, 최대 128,000 토큰의 컨텍스트 창을 지원합니다. 양방향 토큰 분류 아키텍처를 활용하여 이름, 주소, 이메일 주소 등 8가지 범주의 PII를 식별하며, PII-Masking-300k 벤치마크에서 96% F1 점수를 달성했습니다. OpenAI Privacy Filter는 현재 Apache 2.0 라이선스 하에 Hugging Face와 GitHub에서 이용 가능하며, 개발자들이 모델을 로컬에서 배포하고 미세 조정할 수 있도록 합니다. 이번 공개는 민감한 정보를 익명화하는 강력한 도구를 제공함으로써 텍스트 처리 애플리케이션에서의 개인정보 보호를 강화하는 것을 목표로 합니다.