從噪音到控制:參數化擴散策略
研究論文提出參數化擴散策略(PDP)框架,這是一種用於學習擴散策略的方法,條件是嵌入在學習的行為流形中的低維連續參數。通過構建這個流形,使潛在表示之間的距離能反映物理軌跡之間的語義相似性,從而將擴散機制從隨機多樣性轉變為精確且可優化的行為引導工具。這種方法使得可以在已知策略之間進行平滑插值,並高效適應新約束,而無需更新策略權重。論文在模擬和真實機器人實驗中驗證了 PDP 的效果,結果顯示在複雜多模態基準測試中,尤其是在需要合成新行為的場景下,PDP 相較於標準擴散策略顯著提升了適應性能,展示了其在機器人行為控制領域的潛力。
來源
來源:網頁來源