ShaplEIG:用於Shapley值估計的貝葉斯實驗設計方法
研究論文提出一種名為ShaplEIG的新方法,用於近似計算Shapley值。Shapley值是一種廣泛應用於可解釋機器學習的歸因度量,但其精確計算隨玩家數量指數增長,促使多種基於價值函數評估的近似方法發展。論文探討了是否可以通過自適應選擇聯盟來提高近似精度,尤其是在價值函數昂貴且評估次數有限的設置中,如重新訓練特徵重要性、數據估值和超參數重要性。ShaplEIG採用貝葉斯實驗設計,利用高斯過程代理模型來近似昂貴的價值函數,並基於期望信息增益自適應地選擇聯盟進行評估。由於Shapley值在價值函數中呈線性,論文指出期望信息增益可以封閉形式計算。此外,通過初等對稱多項式,計算複雜度從指數級降低到多項式級。在多種昂貴應用的廣泛實驗中,該方法在低預算狀態下一致性地提高了樣本效率,優於現有基線方法。
來源
來源:網頁來源