研究06/02 24:09

基於頻率引導的動作擴散：透過子頻率流形遍歷實現平滑機器人操控

研究論文探討了透過行為克隆學習視覺運動策略的常見挑戰。其指出，人類操作員在收集示範資料時，不可避免地會引入高頻率的雜訊，例如間歇性的頓挫、停頓和動作抖動。若直接模仿這些原始軌跡來訓練策略，模型將繼承這些次優行為。此問題在基於擴散的策略中尤為突出，因為其迭代的去噪步驟可能會意外地放大高頻偽影，從而犧牲了有意義的細節。為解決這些限制，論文提出了一種新穎的基於頻率的演算法，即頻率引導算子（FGO），以實現隱式的頻譜操控與平滑的動作生成。FGO方法透過逐步將嘈雜的樣本引導穿越具有擴展頻譜頻帶的中間子頻率流形，來掌控擴散策略的生成過程。此研究在來自五個基準測試的十五項機器人操控任務上進行了驗證，結果顯示FGO在提升動作平滑度與時間一致性方面取得了卓越性能，同時保留了成功執行任務所需的細節。

來源

來源：Hugging Face / 論文來源

Hugging Face / 論文來源Frequency-Guided Action Diffusion via Sub-Frequency Manifold Traversal