研究06/01 10:05

模型執行失敗偵測框架：Hide-and-Seek

研究論文探討了Vision-Language-Action (VLA) 模型在現實世界部署中面臨的執行失敗問題，這些失敗會影響其可靠性。論文指出，現有的故障偵測方法往往依賴昂貴的動作重複取樣或外部模型，或者僅能將軌跡層級的標籤均勻傳播至每個時間步，從而掩蓋了局部的失敗信號。為此，論文提出了一個名為「Hide-and-Seek」的框架，將VLA的故障偵測重新定義為一個粗略監督的學習問題。該方法結合了軌跡間和軌跡內的對比學習目標，能從軌跡層級的監督信號中自動定位指示失敗的動作，並誘導出具有時間結構的失敗信號，整個過程無需任何步驟級別的標註。研究團隊在LIBERO、VLABench以及一個真實世界機器人平台上，對OpenVLA、π_0和π_{0.5}等三種代表性VLA策略進行了評估。結果顯示，此方法在符合性預測下，在多任務故障偵測方面達到了最先進的性能，並在可見與未見任務上都展現出良好的泛化能力。

來源

來源：Hugging Face / 論文來源

Hugging Face / 論文來源Hide-and-Seek in Trajectories: Discovering Failure Signals for VLA Runtime Monitoring