OpenAI, metindeki kişisel olarak tanımlanabilir bilgileri (PII) tespit etmek ve sansürlemek için tasarlanmış açık kaynaklı bir model olan OpenAI Gizlilik Filtresi'ni tanıttı. Toplamda 1,5 milyar parametre ve 50 milyon aktif parametreye sahip olan model, 128.000 token'a kadar bağlam penceresini desteklemektedir. İsimler, adresler ve e-posta adresleri dahil olmak üzere sekiz PII kategorisini tanımlamak için çift yönlü token sınıflandırma mimarisi kullanmakta ve PII-Masking-300k kıyaslamasında %96 F1 skoru elde etmektedir. OpenAI Gizlilik Filtresi, artık Apache 2.0 lisansı altında Hugging Face ve GitHub üzerinde erişilebilir durumdadır; bu sayede geliştiriciler modeli yerel olarak dağıtabilir ve ince ayar yapabilirler. Bu sürüm, hassas bilgileri anonimleştirmek için güçlü bir araç sunarak metin işleme uygulamalarında gizlilik korumasını artırmayı amaçlamaktadır.