從代理追蹤中歸納推理原語
研究論文提出 Reasoning Primitive Induction 方法,旨在解決 ReAct 風格 LLM 代理經常重新發現相同推理例程的問題。該方法從成功的 ReAct 追蹤中挖掘模式,聚類重複的推理動作,並將最常見的動作轉換為一個緊湊的類型化虛擬工具庫。每個虛擬工具由自然語言文檔字符串指定,在調用時由 LLM 解釋,而標準的 ReAct 循環在測試時組合這些原語。實驗結果顯示,歸納的工具庫在多個基準測試中顯著提升了性能,例如在 RuleArena NBA 任務上從 30% 提升到 74%,在 MuSR 團隊分配上從 38% 提升到 68%,在 NatPlan 會議規劃上從 7% 提升到 29%。此外,這種方法在五個可比較的子任務上都優於零樣本思維鏈方法,匹配或超越專家設計的分解,並以更低的推理成本超過 AWM。
來源
來源:網頁來源