AIセキュリティ企業のPluraiは、カスタマイズされたコンテンツガードレールのための合成トレーニングデータを生成することでAIの安全性を向上させるBARREDフレームワークを発表しました。このフレームワークにより、30億パラメータを持つQwen2.5-3Bモデルは、200億パラメータを持つOpenAIのOSS-Safeguard-20Bモデルを、対話戦略、エージェント出力の検証、医療コンプライアンスなどのタスクで上回ることが可能になります。BARREDフレームワークはタスクを複数の次元に分解し、「非対称ディベート」プロセスを用いてエッジケースのサンプルを洗練させ、精度を大幅に向上させます。評価コードとデータセットはGitHubとHugging Faceで公開されています。