研究06/02 12:35

從噪音到控制：參數化擴散策略

研究論文提出參數化擴散策略（PDP）框架，這是一種用於學習擴散策略的方法，條件是嵌入在學習的行為流形中的低維連續參數。通過構建這個流形，使潛在表示之間的距離能反映物理軌跡之間的語義相似性，從而將擴散機制從隨機多樣性轉變為精確且可優化的行為引導工具。這種方法使得可以在已知策略之間進行平滑插值，並高效適應新約束，而無需更新策略權重。論文在模擬和真實機器人實驗中驗證了 PDP 的效果，結果顯示在複雜多模態基準測試中，尤其是在需要合成新行為的場景下，PDP 相較於標準擴散策略顯著提升了適應性能，展示了其在機器人行為控制領域的潛力。

來源

來源：網頁來源

網頁來源From Noise to Control: Parameterized Diffusion Policies