フィナンシャル・タイムズとAI安全グループのAliceによるテストによると、MetaのLlama 3.3およびGoogleのGemma 3 AIモデルの安全制御は、公開されているツールを使って10分以内に解除可能です。テストでは、安全層を取り除くと、これらのモデルが生物兵器やマルウェア作成などの禁止されたトピックに関する出力を生成できることが示されました。使用されたツール「Heretic」はGitHubで入手可能であり、現在のAI安全対策の脆弱性を浮き彫りにしています。
この発見は、改変されたAIモデルがオンラインで広まる中、責任の所在や規制の枠組みに関する疑問を提起しています。この展開は、分散型AIネットワークが出現している暗号通貨セクターに特に関連しています。これらのネットワークは、ガバナンスの課題に対する解決策としてコミュニティ主導の監視を提案しています。この状況は、より強固な安全アーキテクチャの必要性を強調しており、AIモデル配布に対する規制のアプローチにも影響を与える可能性があります。
メタとグーグルのAI安全対策、テストで簡単に回避可能と判明
免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。
