研究06/02 12:07

閉環神經激活控制於視覺-語言-動作模型中

根據研究論文，視覺-語言-動作（VLA）模型在測試時可透過介入語義上有意義的內部方向來進行控制，但現有方法使用固定的控制係數，實際上處於開環狀態。這種開環方式在具身控制中效果不佳，因為任務狀態和概念誤差會隨時間演變，常導致過度校正、振盪，以及降低任務成功率，尤其是在處理速度和平滑度等時間行為時。為解決此問題，研究提出 CTRL-STEER 框架，將表示與調節解耦：不是假設時間概念由單個神經元直接控制，而是沿著運動對齊的殘差方向進行控制，同時使用反饋控制器在線調整介入強度。CTRL-STEER 實現了基於 PID 和強化學習的控制器。在實驗中，研究團隊使用微調的 OpenVLA 策略，在四個 LIBERO 任務套件上評估，結果表明 CTRL-STEER 相比固定係數基線方法，能達到更穩定的概念調節和更佳的控制-任務成功權衡，且不需要修改或重新訓練基礎模型。

來源

來源：網頁來源

網頁來源Closed-Loop Neural Activation Control in Vision-Language-Action Models