研究06/04 24:39

從代理追蹤中歸納推理原語

研究論文提出 Reasoning Primitive Induction 方法，旨在解決 ReAct 風格 LLM 代理經常重新發現相同推理例程的問題。該方法從成功的 ReAct 追蹤中挖掘模式，聚類重複的推理動作，並將最常見的動作轉換為一個緊湊的類型化虛擬工具庫。每個虛擬工具由自然語言文檔字符串指定，在調用時由 LLM 解釋，而標準的 ReAct 循環在測試時組合這些原語。實驗結果顯示，歸納的工具庫在多個基準測試中顯著提升了性能，例如在 RuleArena NBA 任務上從 30% 提升到 74%，在 MuSR 團隊分配上從 38% 提升到 68%，在 NatPlan 會議規劃上從 7% 提升到 29%。此外，這種方法在五個可比較的子任務上都優於零樣本思維鏈方法，匹配或超越專家設計的分解，並以更低的推理成本超過 AWM。

來源

來源：網頁來源

網頁來源Inducing Reasoning Primitives from Agent Traces