研究06/02 11:06

遮蔽過時觀察有助搜尋代理——直到失效：機制圖及其作用

研究論文提出，在長期搜尋代理中，代理累積大量跨工具呼叫的檢索內容，使得上下文預算效率日益重要。一個最小干預措施是遮蔽過時觀察，但其效果與原因尚不明確。本研究通過系統掃描各種代理骨幹（4B至284B參數）和三個檢索器，在離線和實時網絡基準上進行研究。結果發現，準確度提升與未經上下文管理的模型準確度呈不對稱倒U形：弱檢索器下平緩，強檢索器與中容量模型配合時達到峰值，模型飽和時急劇崩潰。這模式反映了檢索器召回率與模型隱式過濾能力的交互作用，而非單獨因素。機制上，遮蔽實現token-for-turn權衡：它移除模型已基本停止關注的觀察，並分頁代理很少重新開啟的內容。增加的回合有助於將失敗轉為成功，但當遮蔽移除模型本應使用的證據時則會失敗。因此，論文將上下文管理重新定義為機制依賴的干預，並提供整體視角分析代理深度搜索中的上下文使用。此外，研究團隊在GitHub上發布了相關scaffold和軌跡以支持未來研究。

來源

來源：Hugging Face / 論文來源

Hugging Face / 論文來源Masking Stale Observations Helps Search Agents -- Until It Doesn't: A Regime Map and Its Mechanism