研究06/03 01:06

Hamilton-Jacobi 理論在深度學習中的應用

研究論文提出，訓練神經網路的過程可以精確地對應到 Hamilton-Jacobi 初始值問題的搜索。具體而言，每個梯度步驟都在選擇一個粘性 Hamilton-Jacobi 方程的初始數據，該方程的 Hopf-Cole 傳播器最適合觀測數據；在推理階段，輸入是解被評估的空間點，而初始條件已編碼在權重中。這種對應關係對於 log-sum-exp 層是精確的，對於更廣泛的架構如殘差網路、變換器和循環架構（如 RNN、LSTM、SSM）則是結構性的，它們各自離散化同一類 Hamilton-Jacobi 方程，依賴於架構的哈密頓量和粘性。論文進一步提出一個變形參數 ε，它在四種視角（網路、熱帶代數、粘性偏微分方程、凸優化）之間建立了一個交換圖，並在 Lipschitz 條件下封閉。定量結果包括固定 t 時的最小最大最優泛化率 O(n^{-1/(d+2)})、由 ε 控制的對抗魯棒性、殘差網路中作為哈密頓系統共狀態方程的反向傳播、與數據內在維度一致的縮放指數，以及一個閉式 O(N) 影響函數，其熵景觀隨 ε 增加發生折疊分叉，每次合併歸因盆地。

來源

來源：Hugging Face / 論文來源

Hugging Face / 論文來源The Hamilton-Jacobi Theory of Deep Learning