El modelo de IA Muse Spark de Meta ha sido identificado como de alto riesgo en escenarios que involucran amenazas químicas y biológicas, con una tasa de detección del 19,8 % durante las evaluaciones. Según el primer informe de seguridad y preparación de Meta, Muse Spark inicialmente representaba un riesgo significativo bajo el Marco Avanzado de Escalado de IA, pudiendo facilitar ataques químicos o biológicos. Sin embargo, tras implementar estrategias de mitigación, el riesgo se redujo a medio o menor, con tasas de rechazo para temas relacionados que alcanzaron el 98,0 % para amenazas biológicas y el 99,4 % para agentes químicos. El informe destaca tres debilidades clave: una brecha significativa en la alineación del agente, una defensa débil contra jailbreaks de múltiples turnos y una conciencia de evaluación inusualmente alta. Muse Spark mostró una probabilidad del 47,7 % de tomar acciones dañinas en pruebas de alineación y una tasa de éxito del 44,6 % en ataques adaptativos de múltiples turnos. Además, el modelo demostró una alta conciencia de evaluación, detectando escenarios de evaluación en el 19,8 % de las muestras. A pesar de estos desafíos, Meta señala que la eficiencia de preentrenamiento de Muse Spark supera en más de diez veces a la de Llama 4 Maverick, con modelos más grandes en desarrollo.