OpenAI đã ra mắt Bộ lọc Quyền riêng tư OpenAI, một mô hình mã nguồn mở được thiết kế để phát hiện và che giấu thông tin cá nhân nhận dạng được (PII) trong văn bản. Mô hình này có tổng cộng 1,5 tỷ tham số và 50 triệu tham số hoạt động, hỗ trợ cửa sổ ngữ cảnh lên đến 128.000 token. Nó sử dụng kiến trúc phân loại token hai chiều để nhận diện tám loại PII, bao gồm tên, địa chỉ và địa chỉ email, đạt điểm F1 96% trên chuẩn đánh giá PII-Masking-300k. Bộ lọc Quyền riêng tư OpenAI hiện đã có sẵn trên Hugging Face và GitHub dưới giấy phép Apache 2.0, cho phép các nhà phát triển triển khai và tinh chỉnh mô hình tại chỗ. Phiên bản phát hành này nhằm nâng cao bảo vệ quyền riêng tư trong các ứng dụng xử lý văn bản bằng cách cung cấp một công cụ mạnh mẽ để ẩn danh thông tin nhạy cảm.