Das KI-Sicherheitsunternehmen Plurai hat das BARRED-Framework vorgestellt, das die KI-Sicherheit durch die Generierung synthetischer Trainingsdaten für maßgeschneiderte Inhaltsrichtlinien verbessert. Das Framework ermöglicht es dem Qwen2.5-3B-Modell mit 3 Milliarden Parametern, das OSS-Safeguard-20B-Modell von OpenAI mit 20 Milliarden Parametern bei Aufgaben wie Dialogstrategie, Validierung von Agentenausgaben und medizinischer Compliance zu übertreffen. Das BARRED-Framework zerlegt Aufgaben in mehrere Dimensionen und verwendet einen "asymmetrischen Debatten"-Prozess, um Randfallproben zu verfeinern, was die Genauigkeit erheblich verbessert. Der Evaluierungscode und der Datensatz sind auf GitHub und Hugging Face verfügbar.