研究06/03 24:15

世界模型：架構、方法論、推理範式與應用的全面調查

研究論文提出，世界模型作為學習環境結構和動態的內部模擬器，在追求人工通用智慧的過程中已成為核心範式，使智能體能在學習到的表徵中進行預測、規劃和推理。儘管在強化學習、機器人、自動駕駛和視頻生成等領域快速進展，但該領域缺乏統一框架來整合其多樣的架構選擇、訓練方法、推理機制和應用場景。這篇調查論文針對此缺口，提出了一個多軸分類法，沿四個維度組織：架構，涵蓋表徵格式、動態公式化、輸入模態、學習範式和下游應用；方法論家族，包括狀態空間和循環方法、基於變換器的模型、基於擴散的生成器、物理資訊網路和語言增強的多模態系統；推理策略，包括基於想像的規劃、潛在策略學習、反事實推理和不確定性下的規劃；以及應用領域，跨越機器人、自動駕駛、視頻預測、多模態智能體、強化學習、科學建模、醫學影像、教育測量和商業金融。論文追溯該領域從早期認知科學基礎到里程碑系統如PlaNet、Dreamer系列、MuZero、Sora、Cosmos和Genie的發展，審查評估協議和基準，識別持續挑戰如預測錯誤累積、模擬到現實轉移和碎片化評估，並勾勒未來方向，邁向統一的多模態世界模型、基礎規模互動模擬器和安全關鍵領域的安全部署。

來源

來源：網頁來源

網頁來源World Models: A Comprehensive Survey of Architectures, Methodologies, Reasoning Paradigms, and Applications