研究06/01 12:12

大型語言模型可靠性架構：從全域不可能到局部可行

研究論文提出，大型語言模型（LLM）的全域可靠性並非有限問題，因為在所有可能任務中，新的可區分失敗模式會無限出現，使得沒有有限的干預詞典能保證所有模式的殘差錯誤有界。然而，部署的系統實際運作在操作上有限的區塊內，例如法律審查、醫療 RAG、代碼修復、客戶支援代理和合同提取等，這些區塊具有重複的任務、架構、工具和評估者期望。在這些區塊中，經驗證據表明失敗是稀疏、重複且集中於一個小型重複目錄，因此可靠性成為局部目錄發現與干預覆蓋問題，而非指數級標記長度問題。論文透過兩個命題和一個推論形式化這一轉變：命題一為最壞情況模式負結果，指出沒有有限干預詞典能覆蓋無界域中每個可區分失敗模式；推論一為逆發現含義，表明對數上界的模式發現無法容納線性增長的尾部模式，除非指數級增加觀察到的硬失敗事件；命題二為正向局部結果，在對數主動模式暴露和頭重覆蓋下，足夠的每次硬決策干預預算隨序列長度多對數增長，並在區塊目錄飽和後成為域常數。框架重新定位而非溶解長上下文困難，識別軸向干預而非使問題變得容易。

來源

來源：網頁來源

網頁來源The Architecture of Errors: From Universal Impossibility to Patch-Local LLM Reliability