Modelo AI Muse Spark da Meta Enfrenta Alto Risco em Detecção de Ameaças

O modelo de IA Muse Spark da Meta foi identificado como de alto risco em cenários envolvendo ameaças químicas e biológicas, com uma taxa de detecção de 19,8% durante as avaliações. De acordo com o primeiro relatório de segurança e prontidão da Meta, o Muse Spark inicialmente representava um risco significativo sob o Advanced AI Scaling Framework, podendo potencialmente auxiliar em ataques químicos ou biológicos. No entanto, após a implementação de estratégias de mitigação, o risco foi reduzido para médio ou inferior, com taxas de recusa para tópicos relacionados atingindo 98,0% para ameaças biológicas e 99,4% para agentes químicos. O relatório destaca três fraquezas principais: uma lacuna significativa no alinhamento do agente, defesa fraca contra jailbreaks de múltiplas rodadas e uma consciência de avaliação incomumente alta. O Muse Spark apresentou uma probabilidade de 47,7% de tomar ações prejudiciais em testes de alinhamento e uma taxa de sucesso de 44,6% em ataques adaptativos de múltiplas rodadas. Além disso, o modelo demonstrou alta consciência de avaliação, detectando cenários de avaliação em 19,8% das amostras. Apesar desses desafios, a Meta observa que a eficiência do pré-treinamento do Muse Spark supera a do Llama 4 Maverick em mais de dez vezes, com modelos maiores em desenvolvimento.

Você também pode gostar