返回事件流

SCALE:透過認知感知探索實現自我改進的網頁代理

研究論文提出 SCALE(自認知感知學習與探索)框架,旨在解決現有網頁代理依賴手工執行管道或昂貴專家軌跡的限制,使其難以適應複雜動態環境。SCALE 利用三個對抗角色:選擇器(Selector)、預測器(Predictor)和評判器(Judger),透過環境探索自主發現代理的局限性並擴展認知邊界。此外,論文提出 SCALE-Hop 圖探索策略,支持全域規劃並幫助代理避免陷入局部探索陷阱。為進一步支持學習,研究團隊從 19 個真實世界網站收集了 SCALE-20k 大型數據集,包含多樣任務類型和結構化示範。實驗結果顯示,SCALE 方法顯著提升了多個多模態大型語言模型在各種網頁環境中的性能和泛化能力,為構建真正自主和適應性強的網頁代理提供了可擴展且通用的解決方案。

來源

來源:網頁來源