多代理電腦使用系統研究論文
研究論文提出,當前電腦使用代理(CUAs)主要以單一串行代理形式部署,這種設置在處理複雜且長時間跨度的任務時效率較低,容易陷入困境。因此,論文倡導評估和構建多代理電腦使用(MACU)系統,以解決這些不足。MACU 系統的核心設計在於使用一個管理器模型,將電腦使用任務分解為一個有向無環圖(DAG),該圖編碼了子任務之間的依賴關係和目標。在每次迭代中,管理器派遣並行的 CUA 子代理去執行 DAG 中準備就緒的節點,並根據子代理返回的新發現,持續修訂 DAG,例如添加、取消或重寫節點,以適應部分可觀測的環境。實驗結果顯示,在桌面環境基準 OSWorld 和網頁導航基準 Online-Mind2Web、WebTailBench、Odysseys 上,MACU 一致性地超越了強大的單代理基線,性能提升幅度在 3.4% 到 25.5% 之間。此外,MACU 展現了更佳的測試時縮放特性,在 Odysseys 這一長時間網頁導航基準中,將平均任務完成時間縮短了約 1.5 倍,顯示出其在加速傳統緩慢 CUA 管道方面的有效性。這些發現突顯出,多代理協調是將電腦使用代理擴展到更長時間、更高效工作的一個有前景的軸線,研究團隊已將所有代碼和互動式視覺化工具發布在指定的網址上。
來源
來源:Hugging Face / 論文來源
- Hugging Face / 論文來源Multi-Agent Computer Use