修正流中的幾何擦除框架 GEM
多模態生成模型的快速普及帶來了有害內容合成、深偽和版權侵權等風險,概念擦除作為一種潛在的保障措施應運而生。然而,隨著領域從基於 U-Net 的擴散模型逐漸轉向修正流變壓器,擦除研究難以跟上步伐。在這項研究中,研究論文提出 GEM,一個簡單但高效的修正流模型擦除框架。作為貢獻的一部分,論文探討了在基於軌跡的忘卻(根源於生成流網路)和經典教師指導擦除之間建立原則性的橋樑:研究將基於軌跡的信號轉化為教師指導的流匹配設置,統一了兩種範式的優勢。具體而言,教師提供互補的吸引和排斥信號,研究將其結合為單一的幾何指導目標,從而針對性地壓制不需要的概念,同時保留良性生成。這項工作旨在解決生成式 AI 中的倫理與安全問題,為修正流模型的應用提供更可靠的防護機制。
來源
來源:網頁來源