閉環神經激活控制於視覺-語言-動作模型中
根據研究論文,視覺-語言-動作(VLA)模型在測試時可透過介入語義上有意義的內部方向來進行控制,但現有方法使用固定的控制係數,實際上處於開環狀態。這種開環方式在具身控制中效果不佳,因為任務狀態和概念誤差會隨時間演變,常導致過度校正、振盪,以及降低任務成功率,尤其是在處理速度和平滑度等時間行為時。為解決此問題,研究提出 CTRL-STEER 框架,將表示與調節解耦:不是假設時間概念由單個神經元直接控制,而是沿著運動對齊的殘差方向進行控制,同時使用反饋控制器在線調整介入強度。CTRL-STEER 實現了基於 PID 和強化學習的控制器。在實驗中,研究團隊使用微調的 OpenVLA 策略,在四個 LIBERO 任務套件上評估,結果表明 CTRL-STEER 相比固定係數基線方法,能達到更穩定的概念調節和更佳的控制-任務成功權衡,且不需要修改或重新訓練基礎模型。
來源
來源:網頁來源