Meta駭客事件顯示AI安全不僅僅是Mythos的問題
媒體報導指出,2026年6月5日,404媒體報導了一起安全事件,攻擊者利用Meta的AI客戶支援代理竊取Instagram帳戶。攻擊手法十分簡單,他們僅需向AI代理提出要求,將目標帳戶連結到他們控制的電子郵件地址,AI代理便照做無誤。其中包括入侵已休眠的奧巴馬白宮帳戶並發布親伊朗帖子,以及接管具有價值的單詞帳號,可能為了轉售。這起事件引發了對AI安全的廣泛討論,尤其當Anthropic先前宣布其Mythos模型因過於擅長駭客攻擊而無法公開發布後。杜克大學教授Neil Gong指出,隨著AI越來越多用於自動化工作流程如帳戶恢復,攻擊者將更有動機攻擊AI本身。專家長期警告AI代理的安全漏洞,如間接提示注入攻擊,但此次事件方法更為簡單。Meta未公開評論漏洞如何發生,但發言人表示已解決。然而,這暴露了AI代理的核心漏洞:它們能靈活回應但容易被欺騙,且錯誤有現實後果。威斯康星大學教授Somesh Jha指出,AI代理急於完成任務,缺乏人類的謹慎。緩解方法包括使用傳統軟體建立護欄和進行嚴格紅隊測試,但安全與效用存在權衡。隨著AI模型改進,防禦可能改善,但問題只會更緊迫,因為公司希望快速部署強大代理以避免競爭落後。
來源
來源:媒體報導