返回事件流

遮蔽過時觀察有助搜尋代理——直到失效:機制圖及其作用

研究論文提出,在長期搜尋代理中,代理累積大量跨工具呼叫的檢索內容,使得上下文預算效率日益重要。一個最小干預措施是遮蔽過時觀察,但其效果與原因尚不明確。本研究通過系統掃描各種代理骨幹(4B至284B參數)和三個檢索器,在離線和實時網絡基準上進行研究。結果發現,準確度提升與未經上下文管理的模型準確度呈不對稱倒U形:弱檢索器下平緩,強檢索器與中容量模型配合時達到峰值,模型飽和時急劇崩潰。這模式反映了檢索器召回率與模型隱式過濾能力的交互作用,而非單獨因素。機制上,遮蔽實現token-for-turn權衡:它移除模型已基本停止關注的觀察,並分頁代理很少重新開啟的內容。增加的回合有助於將失敗轉為成功,但當遮蔽移除模型本應使用的證據時則會失敗。因此,論文將上下文管理重新定義為機制依賴的干預,並提供整體視角分析代理深度搜索中的上下文使用。此外,研究團隊在GitHub上發布了相關scaffold和軌跡以支持未來研究。

來源

來源:Hugging Face / 論文來源