SkillAdaptor:LLM 代理人的自適應技能框架
HuggingFace 上發布的論文提出 SkillAdaptor,一個專為大型語言模型(LLM)代理人設計的無需訓練逐步技能適應框架,用於解決長視野互動任務。現有技能適應方法通常基於完整軌跡或會話級回饋進行更新,導致失敗歸因粗糙,修訂不穩定或過於寬泛。SkillAdaptor 通過識別失敗軌跡中的第一步可執行錯誤步驟,將責任連結到候選技能,並在顯式接受檢查下應用目標更新,同時保持骨幹網路凍結。研究在 WebShop、PinchBench 和 Claw-Eval 等基準測試上進行評估,使用 Kimi-K2.5、GLM-5 和 GPT-5.2 等模型。結果顯示,SkillAdaptor 在所有測試套件上均優於無技能和技能適應基線,最大改善包括 PinchBench 平均分數提升 1.5 個百分點、Claw-Eval 平均分數提升 1.8 分,以及 WebShop 成功率提升 1.7%。論文代碼將在 GitHub 上發布。
來源
來源:Hugging Face / 論文來源
- Hugging Face / 論文來源SkillAdaptor: Self-Adapting Skills for LLM Agents from Trajectories