返回事件流

透過重整化群方法解釋深度神經網路

研究論文提出,透過建立統計物理中重整化群方法與深度神經網路訓練過程的對應關係,來構建深度學習的解釋性理論。論文指出,先前已使用一維伊辛模型作為輸入數據證明了這一對應關係。現在,研究將結果推廣至連續輸入數據的情況,為應用於實際數據做準備。具體而言,考慮指數族分佈的數據,並證明當全連接深度神經網路的參數在訓練後達到最優值時,其特徵層輸出的特徵參數等於重整化群方法下連續場輸入數據特徵參數的固定點。這表明,深度神經網路的訓練過程等效於此類數據上的重整化群計算,因此網路能像重整化群一樣從輸入數據中提取主要特徵。這一等效性進一步驗證了所建立的對應框架,並為深度神經網路在實際數據上的卓越表現提供了解釋。

來源

來源:網頁來源