研究06/04 24:45

自適應潛在代理推理

研究論文提出自適應潛在代理推理（ALAR）框架，旨在解決大型語言模型代理在多輪決策中效率低下的問題。當前LLM代理常生成冗長的思維鏈推理，導致token使用量過高。ALAR採用雙模式設計，對常規輪次使用緊湊的潛在推理，僅在需要深度思考時升級為明確的思維鏈。該框架通過代理動作作為監督來學習潛在推理，並優化決策以平衡效率與準確性。在代理搜索和工具使用基準測試的實驗中，ALAR展示了出色的性能：它在維持任務準確性的同時，將生成的token數量大幅減少，搜索場景最高減少43.6%，工具使用場景最高減少84.6%。這些結果證實ALAR能有效改善LLM代理的準確性與效率權衡，減少不必要的文本推理，同時保留對複雜決策的明確思考。

來源

來源：網頁來源

網頁來源Adaptive Latent Agentic Reasoning