RelGT-AC:用於關聯式資料庫自動補全的關聯圖變換器
研究論文提出 RelGT-AC,這是一個關聯圖變換器架構,專為關聯式資料庫的自動補全任務設計。關聯式資料庫支撐著現代企業、科學和醫療系統,但由於其多表、異質和時間結構,預測性機器學習應用仍然面臨挑戰。關聯式深度學習(RDL)通過將資料庫表示為異質圖並直接應用圖神經網絡來解決這一問題。RelBench v2 最近引入了自動補全任務,旨在從關聯上下文中預測現有列值,類似智能表單填充助手。RelGT-AC 在 RelGT 架構基礎上進行擴展,提出了三項關鍵貢獻:首先,列遮罩策略通過在子圖編碼期間遮罩目標列來防止簡單解決方案;其次,統一任務頭支持在單一模型內進行二元分類、多類分類和回歸自動補全任務;最後,TF-IDF 文本編碼器自動檢測並編碼自由文本列,恢復了類別編碼器丟失的詞彙信號。在 RelBench v2 的三個數據集(rel-trial、rel-f1、rel-stack)上的七個任務測試中,RelGT-AC 在所有三個回歸自動補全任務上超越了 GraphSAGE 基線,並在文本密集的資格任務中通過 TF-IDF 編碼器實現了高達 +10 AUROC 分的提升。
來源
來源:網頁來源