研究06/01 12:15

透過機械可解釋性發現 Dyck 路徑上的 Zeta 映射算法

研究論文提出，機械學習在數學發現中日益普及，但數學領域的目標往往是產生可獨立驗證的明確構造，而非單純預測。本研究通過 Dyck 路徑上的 zeta 映射——一個在 q,t-Catalan 數字組合學中的經典雙射——來探討此議題。研究者訓練了一個刻意設計的小型單層單頭編碼器-解碼器 Transformer 模型，並使用機械可解釋性工具進行分析，包括解碼器交叉注意力分析、線性探測和因果干預。分析揭示了一個基於層級的機制：編碼器表示使路徑層級線性可存取，而解碼器則以結構化方式選擇和遍歷輸入位置。將這些信號轉化為組合學，研究者提出了 scaffolding map，一個顯式的峰值中心遍歷算法。他們證明此算法與 zeta 映射一致，僅在標籤反轉約定上有所差異。這為 AI 輔助數學發現提供了一個受控範例，展示了機械可解釋性如何將模型行為轉化為精確、人類可驗證的組合算法。

來源

來源：網頁來源

網頁來源Discovering a Zeta Map Algorithm on Dyck Paths via Mechanistic Interpretability