研究06/05 24:07

GRAIL：從3D資產和影片先驗生成人形機器人運動操作

研究論文提出GRAIL，這是一個數字生成管道，旨在擴展人形機器人的運動操作能力。傳統方法如遠程操作和動作捕捉難以規模化，因為依賴物理設置、儀器化演員和機器人操作。GRAIL保持完全虛擬，直到部署階段，它組合3D資產、模擬器就緒場景和影片基礎模型的先驗知識，合成交互數據，無需重建物理環境。通過完全指定的3D配置，包括物體幾何、相機參數和度量尺度，減少深度歧義和形態不匹配，從而重建度量4D人形-物體交互軌跡。恢復的動作被重新定位到人形機器人，並訓練任務通用追蹤器，如物體感知潛在適配器和場景感知追蹤器。論文使用僅GRAIL生成的數據，通過模擬到真實管道訓練自我中心視覺策略，並在Unitree G1人形機器人上部署，實現多樣化物體拾取84%和爬樓梯90%的真實世界成功率。

來源：Hugging Face / 論文來源

Hugging Face / 論文來源GRAIL: Generating Humanoid Loco-Manipulation from 3D Assets and Video Priors