返回事件流

真實世界數據集是否包含自然實驗?一項使用因果特徵選擇的實證研究

研究論文提出,自然實驗是指那些影響部分個體或群體而非全部的事件,構成隱性干預。例如,COVID-19 大流行是冠狀病毒對感染子群的干預。論文探討現有真實世界數據集是否包含此類自然實驗,並如何處理它們。研究使用因果發現來恢復潛在因果圖,並基於因果連結進行特徵選擇。如果通過將數據視為干預性而非觀察性,下游效能提升,則表明數據集包含自然實驗。研究首先通過合成圖模擬數據集驗證假設,然後對一系列真實世界數據集進行系統性實證評估。結果表明,真實世界數據集確實包含自然實驗,且我們可以利用這些自然實驗通過因果推理提升模型效能。這項工作代表了該領域的初步探索,在有限範圍內提供初步研究。

來源:網頁來源