自適應潛在代理推理
研究論文提出自適應潛在代理推理(ALAR)框架,旨在解決大型語言模型代理在多輪決策中效率低下的問題。當前LLM代理常生成冗長的思維鏈推理,導致token使用量過高。ALAR採用雙模式設計,對常規輪次使用緊湊的潛在推理,僅在需要深度思考時升級為明確的思維鏈。該框架通過代理動作作為監督來學習潛在推理,並優化決策以平衡效率與準確性。在代理搜索和工具使用基準測試的實驗中,ALAR展示了出色的性能:它在維持任務準確性的同時,將生成的token數量大幅減少,搜索場景最高減少43.6%,工具使用場景最高減少84.6%。這些結果證實ALAR能有效改善LLM代理的準確性與效率權衡,減少不必要的文本推理,同時保留對複雜決策的明確思考。
來源
來源:網頁來源