A OpenAI revelou o OpenAI Privacy Filter, um modelo de código aberto projetado para detectar e redigir informações pessoalmente identificáveis (PII) em texto. O modelo, com 1,5 bilhão de parâmetros totais e 50 milhões de parâmetros ativos, suporta uma janela de contexto de até 128.000 tokens. Ele utiliza uma arquitetura de classificação de tokens bidirecional para identificar oito categorias de PII, incluindo nomes, endereços e endereços de e-mail, alcançando uma pontuação F1 de 96% no benchmark PII-Masking-300k. O OpenAI Privacy Filter está agora acessível no Hugging Face e no GitHub sob a licença Apache 2.0, permitindo que desenvolvedores implantem e ajustem o modelo localmente. Este lançamento visa aprimorar a proteção da privacidade em aplicações de processamento de texto, fornecendo uma ferramenta robusta para anonimizar informações sensíveis.