OpenAIは、テキスト内の個人を特定できる情報(PII)を検出および編集するために設計されたオープンソースモデル「OpenAI Privacy Filter」を発表しました。このモデルは、総パラメータ数15億、アクティブパラメータ数5000万を特徴とし、最大128,000トークンのコンテキストウィンドウをサポートしています。双方向トークンクラス分類アーキテクチャを利用して、名前、住所、メールアドレスなど8つのPIIカテゴリを識別し、PII-Masking-300kベンチマークで96%のF1スコアを達成しています。 OpenAI Privacy Filterは現在、Apache 2.0ライセンスの下でHugging FaceおよびGitHubで利用可能であり、開発者はモデルをローカルで展開および微調整できます。このリリースは、機密情報の匿名化のための強力なツールを提供することで、テキスト処理アプリケーションにおけるプライバシー保護の強化を目的としています。