La empresa de seguridad en IA Plurai ha presentado el marco BARRED, que mejora la seguridad de la IA generando datos sintéticos de entrenamiento para salvaguardas de contenido personalizadas. El marco permite que el modelo Qwen2.5-3B, con 3 mil millones de parámetros, supere al modelo OSS-Safeguard-20B de OpenAI, que cuenta con 20 mil millones de parámetros, en tareas como estrategia de diálogo, validación de salida de agentes y cumplimiento médico. El marco BARRED descompone las tareas en múltiples dimensiones y utiliza un proceso de "debate asimétrico" para refinar muestras de casos límite, mejorando significativamente la precisión. El código de evaluación y el conjunto de datos están disponibles en GitHub y Hugging Face.
Modelo de 3 mil millones de parámetros supera a modelo de 20 mil millones en tareas de seguridad de IA
Aviso legal: El contenido de Phemex News es únicamente informativo.No garantizamos la calidad, precisión ni integridad de la información procedente de artículos de terceros.El contenido de esta página no constituye asesoramiento financiero ni de inversión.Le recomendamos encarecidamente que realice su propia investigación y consulte con un asesor financiero cualificado antes de tomar cualquier decisión de inversión.
