返回事件流

小型但可信:用於時間序列異常偵測的高效視覺語言推理

近期,視覺語言模型在眾多任務中展現出令人印象深刻的性能,但先前研究指出,在將大型語言或多模態模型應用於尋找序列數據中的異常模式時,表現並不理想。公開的異常偵測基準通常提供區間標註,但缺乏自然語言解釋,這使得微調視覺語言模型以產生有根據、可解釋的決策變得困難。研究論文提出,為了解決這個缺口,團隊構建了 VisAnomBench,這是一個從公開時間序列數據集策劃的基準,並使用來自多個大型視覺語言模型的高質量異常解釋進行增強。通過在此基準上進行微調,他們開發了 VisAnomReasoner,這是一個參數高效的視覺語言模型,專門用於時間序列異常偵測。實驗結果在 VisAnomBench 上顯示,VisAnomReasoner 實現了更準確的異常定位,並且在精確度和 F1 分數上分別至少提升了 21.23 和 23.87 個百分點。此外,在 TSB-AD-U 基準上的實驗進一步證實了其強大的跨基準泛化能力,精確度和 F1 分數分別提升了 9.57 和 13.39 個百分點。這項研究為時間序列異常偵測提供了新的方法和基準,有望推動相關領域的發展。

來源

來源:Hugging Face / 論文來源