研究06/04 01:07

ReLoRA：為持續演進的LLM服務快速恢復LoRA適配器

研究論文提出ReLoRA框架，旨在解決大型語言模型服務在基礎模型頻繁更新時，先前部署的任務特定低秩適應（LoRA）適配器失效的問題。對於管理眾多下游模型服務的供應商而言，每次基礎模型更新後都從頭重新訓練每個LoRA適配器，在計算上極其昂貴且會延遲服務推出。論文探討指出，簡單地將原始適配器應用於更新後的基礎模型，常因適配器與骨幹模型不相容而導致服務品質下降。ReLoRA透過兩個關鍵優化步驟應對此挑戰：一是利用貝葉斯優化構建具相容性感知的起始點，融合先前部署的適配器與基礎模型演進的資訊；二是採用帶排程正則化的微調，先以強正則化快速引導適配器至高品質區域，再以鬆弛正則化進行任務特定精煉。實驗表明，與基線方法相比，ReLoRA能將服務準備時間最多縮短8.9倍，並將準確率最多提升4.6%。

來源

來源：網頁來源

網頁來源ReLoRA: Knowledge-Reusing Adaptation for Fast Rollout of Evolving LLM Services