研究05/31 17:53

小型但可信：用於時間序列異常偵測的高效視覺語言推理

近期，視覺語言模型在眾多任務中展現出令人印象深刻的性能，但先前研究指出，在將大型語言或多模態模型應用於尋找序列數據中的異常模式時，表現並不理想。公開的異常偵測基準通常提供區間標註，但缺乏自然語言解釋，這使得微調視覺語言模型以產生有根據、可解釋的決策變得困難。研究論文提出，為了解決這個缺口，團隊構建了 VisAnomBench，這是一個從公開時間序列數據集策劃的基準，並使用來自多個大型視覺語言模型的高質量異常解釋進行增強。通過在此基準上進行微調，他們開發了 VisAnomReasoner，這是一個參數高效的視覺語言模型，專門用於時間序列異常偵測。實驗結果在 VisAnomBench 上顯示，VisAnomReasoner 實現了更準確的異常定位，並且在精確度和 F1 分數上分別至少提升了 21.23 和 23.87 個百分點。此外，在 TSB-AD-U 基準上的實驗進一步證實了其強大的跨基準泛化能力，精確度和 F1 分數分別提升了 9.57 和 13.39 個百分點。這項研究為時間序列異常偵測提供了新的方法和基準，有望推動相關領域的發展。

來源

來源：Hugging Face / 論文來源

Hugging Face / 論文來源Tiny but Trusted: Efficient Vision-Language Reasoning for Time-Series Anomaly Detection