大型語言模型可靠性架構:從全域不可能到局部可行
研究論文提出,大型語言模型(LLM)的全域可靠性並非有限問題,因為在所有可能任務中,新的可區分失敗模式會無限出現,使得沒有有限的干預詞典能保證所有模式的殘差錯誤有界。然而,部署的系統實際運作在操作上有限的區塊內,例如法律審查、醫療 RAG、代碼修復、客戶支援代理和合同提取等,這些區塊具有重複的任務、架構、工具和評估者期望。在這些區塊中,經驗證據表明失敗是稀疏、重複且集中於一個小型重複目錄,因此可靠性成為局部目錄發現與干預覆蓋問題,而非指數級標記長度問題。論文透過兩個命題和一個推論形式化這一轉變:命題一為最壞情況模式負結果,指出沒有有限干預詞典能覆蓋無界域中每個可區分失敗模式;推論一為逆發現含義,表明對數上界的模式發現無法容納線性增長的尾部模式,除非指數級增加觀察到的硬失敗事件;命題二為正向局部結果,在對數主動模式暴露和頭重覆蓋下,足夠的每次硬決策干預預算隨序列長度多對數增長,並在區塊目錄飽和後成為域常數。框架重新定位而非溶解長上下文困難,識別軸向干預而非使問題變得容易。
來源
來源:網頁來源