La société de sécurité en intelligence artificielle Plurai a dévoilé le cadre BARRED, qui améliore la sécurité de l'IA en générant des données d'entraînement synthétiques pour des garde-fous de contenu personnalisés. Ce cadre permet au modèle Qwen2.5-3B, doté de 3 milliards de paramètres, de surpasser le modèle OSS-Safeguard-20B d'OpenAI, qui compte 20 milliards de paramètres, dans des tâches telles que la stratégie de dialogue, la validation des sorties des agents et la conformité médicale. Le cadre BARRED décompose les tâches en plusieurs dimensions et utilise un processus de "débat asymétrique" pour affiner les échantillons de cas limites, améliorant ainsi significativement la précision. Le code d'évaluation et le jeu de données sont disponibles sur GitHub et Hugging Face.