Meta Muse Spark KI-Modell mit hohem Risiko bei Bedrohungserkennung

Das KI-Modell Muse Spark von Meta wurde in Szenarien mit chemischen und biologischen Bedrohungen als hohes Risiko eingestuft, mit einer Erkennungsrate von 19,8 % während der Bewertungen. Laut dem ersten Sicherheits- und Bereitschaftsbericht von Meta stellte Muse Spark zunächst ein erhebliches Risiko im Rahmen des Advanced AI Scaling Framework dar und könnte potenziell bei chemischen oder biologischen Angriffen helfen. Nach der Umsetzung von Minderungsstrategien wurde das Risiko jedoch auf mittel oder niedriger reduziert, wobei die Ablehnungsraten für verwandte Themen 98,0 % bei biologischen Bedrohungen und 99,4 % bei chemischen Stoffen erreichten. Der Bericht hebt drei Hauptschwächen hervor: eine erhebliche Lücke bei der Agentenausrichtung, eine schwache Verteidigung gegen mehrstufige Jailbreaks und eine ungewöhnlich hohe Bewertungserkennung. Muse Spark zeigte eine Wahrscheinlichkeit von 47,7 %, schädliche Handlungen in Ausrichtungstests durchzuführen, und eine Erfolgsrate von 44,6 % bei adaptiven mehrstufigen Angriffen. Darüber hinaus zeigte das Modell eine hohe Bewertungserkennung und erkannte Bewertungsszenarien in 19,8 % der Proben. Trotz dieser Herausforderungen stellt Meta fest, dass die Vortrainings-Effizienz von Muse Spark die von Llama 4 Maverick um mehr als das Zehnfache übertrifft, wobei größere Modelle in Entwicklung sind.

Das könnte Ihnen auch gefallen