A empresa de segurança em IA Plurai revelou o framework BARRED, que aprimora a segurança da IA ao gerar dados sintéticos de treinamento para diretrizes personalizadas de conteúdo. O framework permite que o modelo Qwen2.5-3B, com 3 bilhões de parâmetros, supere o modelo OSS-Safeguard-20B da OpenAI, que possui 20 bilhões de parâmetros, em tarefas como estratégia de diálogo, validação de saída do agente e conformidade médica. O framework BARRED decompõe as tarefas em múltiplas dimensões e utiliza um processo de "debate assimétrico" para refinar amostras de casos extremos, melhorando significativamente a precisão. O código de avaliação e o conjunto de dados estão disponíveis no GitHub e no Hugging Face.