La empresa de seguridad en IA Plurai ha presentado el marco BARRED, que mejora la seguridad de la IA generando datos sintéticos de entrenamiento para salvaguardas de contenido personalizadas. El marco permite que el modelo Qwen2.5-3B, con 3 mil millones de parámetros, supere al modelo OSS-Safeguard-20B de OpenAI, que cuenta con 20 mil millones de parámetros, en tareas como estrategia de diálogo, validación de salida de agentes y cumplimiento médico. El marco BARRED descompone las tareas en múltiples dimensiones y utiliza un proceso de "debate asimétrico" para refinar muestras de casos límite, mejorando significativamente la precisión. El código de evaluación y el conjunto de datos están disponibles en GitHub y Hugging Face.