研究06/01 12:12

ElasticMem：LLM 代理的可學習潛在記憶

研究論文提出 ElasticMem，一個專為大型語言模型（LLM）代理設計的記憶增強框架。現有方法通常將記憶視為固定資源，導致 token 開銷大或依賴於剛性檢索。ElasticMem 則將記憶視為彈性潛在資源，透過建立離線潛在記憶庫，並從推理器的隱藏狀態自適應檢索記憶。它為每個檢索到的記憶分配一個可變的潛在預算，然後將選中的潛在狀態作為軟記憶標記注入生成過程，整個記憶使用流程通過群體相對策略優化進行訓練。實驗在 MemorySuite 上進行，涵蓋記憶密集型問答和具身代理控制任務。使用 Qwen2.5-3B-Instruct 和 Qwen2.5-7B-Instruct 模型，ElasticMem 在加權平均問答準確率上分別提升 26.2% 和 24.6%，在 ALFWorld 成功率上提升 66.3% 和 27.2%，同時實現最低的 token 成本。消融研究和定性分析進一步顯示，自適應檢索和彈性預算分配有助於 ElasticMem 優先處理有用的證據和可轉移的計劃，超越剛性的餘弦相似度方法。論文代碼將在 GitHub 上發布。

來源

來源：網頁來源

網頁來源ElasticMem: Latent Memory as a Learnable Resource for LLM Agents