返回事件流

ReLoRA:為持續演進的LLM服務快速恢復LoRA適配器

研究論文提出ReLoRA框架,旨在解決大型語言模型服務在基礎模型頻繁更新時,先前部署的任務特定低秩適應(LoRA)適配器失效的問題。對於管理眾多下游模型服務的供應商而言,每次基礎模型更新後都從頭重新訓練每個LoRA適配器,在計算上極其昂貴且會延遲服務推出。論文探討指出,簡單地將原始適配器應用於更新後的基礎模型,常因適配器與骨幹模型不相容而導致服務品質下降。ReLoRA透過兩個關鍵優化步驟應對此挑戰:一是利用貝葉斯優化構建具相容性感知的起始點,融合先前部署的適配器與基礎模型演進的資訊;二是採用帶排程正則化的微調,先以強正則化快速引導適配器至高品質區域,再以鬆弛正則化進行任務特定精煉。實驗表明,與基線方法相比,ReLoRA能將服務準備時間最多縮短8.9倍,並將準確率最多提升4.6%。

來源

來源:網頁來源