超越整體模型:深度多元時間序列預測的系統性組件級基準測試
研究論文提出 TSCOMP,這是首個大規模基準,系統性地將深度多元時間序列預測方法分解為細粒度組件,包括序列預處理、編碼策略、網路架構(包含特定及大型時間序列模型)以及優化方法。透過約束正交實驗設計和廣泛評估,進行多視角分析,揭示不同骨幹網路、數據特性及其交互作用下的組件有效性。除了提供見解,此基準建立了一個細粒度性能語料庫,涵蓋超過 20,000 個模型-數據集評估,支持學習自動組件選擇,實現新數據集上的零樣本模型構建。實驗表明,儘管簡單,語料庫驅動的方法持續超越最先進方法,驗證了評估設計的健全性,並確認系統性組件選擇優於手動設計的複雜架構。所有代碼和性能語料庫已在 GitHub 公開提供。
來源
來源:Hugging Face / 論文來源