OpenAI представила OpenAI Privacy Filter — модель с открытым исходным кодом, предназначенную для обнаружения и редактирования персональных данных (PII) в тексте. Модель имеет 1,5 миллиарда параметров в общей сложности и 50 миллионов активных параметров, поддерживает контекстное окно до 128 000 токенов. Она использует двунаправленную архитектуру классификации токенов для идентификации восьми категорий персональных данных, включая имена, адреса и электронные почты, достигая 96% F1-оценки на эталоне PII-Masking-300k. OpenAI Privacy Filter теперь доступен на Hugging Face и GitHub под лицензией Apache 2.0, что позволяет разработчикам развертывать и дообучать модель локально. Этот релиз направлен на повышение защиты конфиденциальности в приложениях для обработки текста, предоставляя надежный инструмент для анонимизации чувствительной информации.