OpenAI ha presentado el OpenAI Privacy Filter, un modelo de código abierto diseñado para detectar y redactar información personal identificable (PII) en texto. El modelo, que cuenta con 1.5 mil millones de parámetros totales y 50 millones de parámetros activos, soporta una ventana de contexto de hasta 128,000 tokens. Utiliza una arquitectura de clasificación de tokens bidireccional para identificar ocho categorías de PII, incluyendo nombres, direcciones y correos electrónicos, logrando una puntuación F1 del 96% en el benchmark PII-Masking-300k. El OpenAI Privacy Filter ya está disponible en Hugging Face y GitHub bajo la licencia Apache 2.0, lo que permite a los desarrolladores desplegar y ajustar el modelo localmente. Esta versión tiene como objetivo mejorar la protección de la privacidad en aplicaciones de procesamiento de texto proporcionando una herramienta robusta para anonimizar información sensible.