HADT:異質多代理差異轉換器用於自主地球觀測衛星叢集
在 arXiv 上發布的研究論文探討異質衛星叢集進行地球觀測任務時的自主資源管理挑戰。傳統方法依賴數學模型和優化算法,但在動態和不確定的太空環境中,這些模型可能不準確或過於複雜。論文將問題重新表述為序列決策過程,並應用模型自由強化學習來實現自適應和即時管理。研究者設計了 HADT 架構,這是一種新穎的轉換器模型,專為異質衛星叢集優化,引入了關係觀察-動作標記化和差異注意力機制。實驗結果證實,HADT 在多種情境下均優於現有基準方法,同時在衛星叢集規模變化時保持高適應性和可轉移性,為未來衛星自主運作提供了潛在解決方案。
來源
來源:網頁來源