世界模型:架構、方法論、推理範式與應用的全面調查
研究論文提出,世界模型作為學習環境結構和動態的內部模擬器,在追求人工通用智慧的過程中已成為核心範式,使智能體能在學習到的表徵中進行預測、規劃和推理。儘管在強化學習、機器人、自動駕駛和視頻生成等領域快速進展,但該領域缺乏統一框架來整合其多樣的架構選擇、訓練方法、推理機制和應用場景。這篇調查論文針對此缺口,提出了一個多軸分類法,沿四個維度組織:架構,涵蓋表徵格式、動態公式化、輸入模態、學習範式和下游應用;方法論家族,包括狀態空間和循環方法、基於變換器的模型、基於擴散的生成器、物理資訊網路和語言增強的多模態系統;推理策略,包括基於想像的規劃、潛在策略學習、反事實推理和不確定性下的規劃;以及應用領域,跨越機器人、自動駕駛、視頻預測、多模態智能體、強化學習、科學建模、醫學影像、教育測量和商業金融。論文追溯該領域從早期認知科學基礎到里程碑系統如PlaNet、Dreamer系列、MuZero、Sora、Cosmos和Genie的發展,審查評估協議和基準,識別持續挑戰如預測錯誤累積、模擬到現實轉移和碎片化評估,並勾勒未來方向,邁向統一的多模態世界模型、基礎規模互動模擬器和安全關鍵領域的安全部署。
來源
來源:網頁來源