研究06/02 11:06

SkillAdaptor：LLM 代理人的自適應技能框架

HuggingFace 上發布的論文提出 SkillAdaptor，一個專為大型語言模型（LLM）代理人設計的無需訓練逐步技能適應框架，用於解決長視野互動任務。現有技能適應方法通常基於完整軌跡或會話級回饋進行更新，導致失敗歸因粗糙，修訂不穩定或過於寬泛。SkillAdaptor 通過識別失敗軌跡中的第一步可執行錯誤步驟，將責任連結到候選技能，並在顯式接受檢查下應用目標更新，同時保持骨幹網路凍結。研究在 WebShop、PinchBench 和 Claw-Eval 等基準測試上進行評估，使用 Kimi-K2.5、GLM-5 和 GPT-5.2 等模型。結果顯示，SkillAdaptor 在所有測試套件上均優於無技能和技能適應基線，最大改善包括 PinchBench 平均分數提升 1.5 個百分點、Claw-Eval 平均分數提升 1.8 分，以及 WebShop 成功率提升 1.7%。論文代碼將在 GitHub 上發布。

來源

來源：Hugging Face / 論文來源

Hugging Face / 論文來源SkillAdaptor: Self-Adapting Skills for LLM Agents from Trajectories