快訊06/11 19:36

Google DeepMind 擔憂數百萬代理互動的風險

媒體報導指出，Google DeepMind 正在資助一項研究，探討數百萬個不同 AI 代理在網上互動時的潛在危險。據該公司 AGI 安全與對齊研究主管 Rohin Shah 表示，能夠執行任務且無需人類監督、並遵循其他代理指令的代理大量出現，帶來了全新的風險類別。為應對此問題，Google DeepMind 與多個組織合作，宣布設立 1000 萬美元的資金池，用於資助研究多代理系統的行為並防止不安全場景。合作方包括 Schmidt Sciences、英國政府的 ARIA、Cooperative AI 基金會以及 Google.org。研究旨在啟動學術界對多代理安全的研究，因為 Shah 認為這方面領域尚未形成，希望學術界能提前介入。風險主要包括互聯網上已發生的惡化版本，如詐騙、提示注入和其他網絡攻擊形式，這些可能威脅數字公共空間的安全。Shah 和 Schmidt Sciences 的 James Fox 強調，需要通過現實模擬來研究大量代理互動，因為單個代理的行為無法預測整體結果。此外，其他 AI 公司如 Anthropic 也發布了部署 AI 代理的指南，基於零信任安全原則，強調假設系統脆弱。網路安全專家 Rafael Angel 指出，代理打破了傳統安全假設，因其能推理和應變，因此這項資助至關重要，但需注意解決實際存在的問題，而非僅關注假設性風險。這項合作反映了 AI 行業對潛在風險的警覺，並尋求在代理技術廣泛應用前建立安全基礎。

來源：媒體報導

媒體報導Google DeepMind is worried about what happens when millions of agents start to interact