ElasticMem:LLM 代理的可學習潛在記憶
研究論文提出 ElasticMem,一個專為大型語言模型(LLM)代理設計的記憶增強框架。現有方法通常將記憶視為固定資源,導致 token 開銷大或依賴於剛性檢索。ElasticMem 則將記憶視為彈性潛在資源,透過建立離線潛在記憶庫,並從推理器的隱藏狀態自適應檢索記憶。它為每個檢索到的記憶分配一個可變的潛在預算,然後將選中的潛在狀態作為軟記憶標記注入生成過程,整個記憶使用流程通過群體相對策略優化進行訓練。實驗在 MemorySuite 上進行,涵蓋記憶密集型問答和具身代理控制任務。使用 Qwen2.5-3B-Instruct 和 Qwen2.5-7B-Instruct 模型,ElasticMem 在加權平均問答準確率上分別提升 26.2% 和 24.6%,在 ALFWorld 成功率上提升 66.3% 和 27.2%,同時實現最低的 token 成本。消融研究和定性分析進一步顯示,自適應檢索和彈性預算分配有助於 ElasticMem 優先處理有用的證據和可轉移的計劃,超越剛性的餘弦相似度方法。論文代碼將在 GitHub 上發布。
來源
來源:網頁來源