返回事件流

模型執行失敗偵測框架:Hide-and-Seek

研究論文探討了Vision-Language-Action (VLA) 模型在現實世界部署中面臨的執行失敗問題,這些失敗會影響其可靠性。論文指出,現有的故障偵測方法往往依賴昂貴的動作重複取樣或外部模型,或者僅能將軌跡層級的標籤均勻傳播至每個時間步,從而掩蓋了局部的失敗信號。為此,論文提出了一個名為「Hide-and-Seek」的框架,將VLA的故障偵測重新定義為一個粗略監督的學習問題。該方法結合了軌跡間和軌跡內的對比學習目標,能從軌跡層級的監督信號中自動定位指示失敗的動作,並誘導出具有時間結構的失敗信號,整個過程無需任何步驟級別的標註。研究團隊在LIBERO、VLABench以及一個真實世界機器人平台上,對OpenVLA、π_0和π_{0.5}等三種代表性VLA策略進行了評估。結果顯示,此方法在符合性預測下,在多任務故障偵測方面達到了最先進的性能,並在可見與未見任務上都展現出良好的泛化能力。

來源

來源:Hugging Face / 論文來源