MetaとGoogleのAI安全対策が数分で突破

フィナンシャル・タイムズとAI安全グループのAliceによるテストによると、MetaのLlama 3.3およびGoogleのGemma 3 AIモデルの安全制御は、公開されているツールを使って10分以内に解除可能です。テストでは、安全層を取り除くと、これらのモデルが生物兵器やマルウェア作成などの禁止されたトピックに関する出力を生成できることが示されました。使用されたツール「Heretic」はGitHubで入手可能であり、現在のAI安全対策の脆弱性を浮き彫りにしています。この発見は、改変されたAIモデルがオンラインで広まる中、責任の所在や規制の枠組みに関する疑問を提起しています。この展開は、分散型AIネットワークが出現している暗号通貨セクターに特に関連しています。これらのネットワークは、ガバナンスの課題に対する解決策としてコミュニティ主導の監視を提案しています。この状況は、より強固な安全アーキテクチャの必要性を強調しており、AIモデル配布に対する規制のアプローチにも影響を与える可能性があります。

​​こちらもおすすめ​​

こちらもおすすめ