透過機械可解釋性發現 Dyck 路徑上的 Zeta 映射算法
研究論文提出,機械學習在數學發現中日益普及,但數學領域的目標往往是產生可獨立驗證的明確構造,而非單純預測。本研究通過 Dyck 路徑上的 zeta 映射——一個在 q,t-Catalan 數字組合學中的經典雙射——來探討此議題。研究者訓練了一個刻意設計的小型單層單頭編碼器-解碼器 Transformer 模型,並使用機械可解釋性工具進行分析,包括解碼器交叉注意力分析、線性探測和因果干預。分析揭示了一個基於層級的機制:編碼器表示使路徑層級線性可存取,而解碼器則以結構化方式選擇和遍歷輸入位置。將這些信號轉化為組合學,研究者提出了 scaffolding map,一個顯式的峰值中心遍歷算法。他們證明此算法與 zeta 映射一致,僅在標籤反轉約定上有所差異。這為 AI 輔助數學發現提供了一個受控範例,展示了機械可解釋性如何將模型行為轉化為精確、人類可驗證的組合算法。
來源
來源:網頁來源