GRAIL:從3D資產和影片先驗生成人形機器人運動操作
研究論文提出GRAIL,這是一個數字生成管道,旨在擴展人形機器人的運動操作能力。傳統方法如遠程操作和動作捕捉難以規模化,因為依賴物理設置、儀器化演員和機器人操作。GRAIL保持完全虛擬,直到部署階段,它組合3D資產、模擬器就緒場景和影片基礎模型的先驗知識,合成交互數據,無需重建物理環境。通過完全指定的3D配置,包括物體幾何、相機參數和度量尺度,減少深度歧義和形態不匹配,從而重建度量4D人形-物體交互軌跡。恢復的動作被重新定位到人形機器人,並訓練任務通用追蹤器,如物體感知潛在適配器和場景感知追蹤器。論文使用僅GRAIL生成的數據,通過模擬到真實管道訓練自我中心視覺策略,並在Unitree G1人形機器人上部署,實現多樣化物體拾取84%和爬樓梯90%的真實世界成功率。
來源:Hugging Face / 論文來源
- Hugging Face / 論文來源GRAIL: Generating Humanoid Loco-Manipulation from 3D Assets and Video Priors