AIセキュリティ企業のPluraiは、カスタマイズされたコンテンツガードレールのための合成トレーニングデータを生成することでAIの安全性を向上させるBARREDフレームワークを発表しました。このフレームワークにより、30億パラメータを持つQwen2.5-3Bモデルは、200億パラメータを持つOpenAIのOSS-Safeguard-20Bモデルを、対話戦略、エージェント出力の検証、医療コンプライアンスなどのタスクで上回ることが可能になります。BARREDフレームワークはタスクを複数の次元に分解し、「非対称ディベート」プロセスを用いてエッジケースのサンプルを洗練させ、精度を大幅に向上させます。評価コードとデータセットはGitHubとHugging Faceで公開されています。
3BパラメータモデルがAI安全性タスクで20Bパラメータモデルを上回る
免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。
