ERICA:量化聚類分析的可複製性
研究論文提出 ERICA(評估可複製性通過迭代聚類分配)分析框架,旨在量化聚類分析的可複製性。論文探討了聚類技術在科學研究中廣泛應用,但其結果缺乏定量檢查的問題。ERICA 通過迭代計算聚類分配,並生成統計量來描述數據集中的結構,同時提供定量可視化方法,以評估聚類相似性和識別異常點。在合成數據測試中,ERICA 顯示聚類以可複製的方式被發現;然而,當應用於三個乳腺癌基因表達數據集進行亞型驗證時,結果可能呈現不可複製性。這項研究強調了對聚類結果進行嚴格檢查的必要性,並提供了一個實用工具來進行此類評估,以提升科學研究的可靠性。
來源
來源:網頁來源