研究05/31 17:55

思考先於約束：大型語言模型的統一解碼框架

研究論文提出一種名為 In-Writing 的統一解碼框架，用於大型語言模型。論文探討指出，自然生成允許模型產出自由形式的回應，富含推理能力，但缺乏結構導致輸出難以驗證；反之，約束解碼能確保標準化格式，但過早施加約束可能無意中限制推理能力。In-Writing 方法在單次調用中結合自由推理和結構化生成，模型首先執行無約束推理，當生成一個觸發令牌後才應用結構化解碼，明確地將推理與格式化解耦。研究建立觸發令牌策略，幾乎消除過早觸發的失敗模式，其中約束解碼中斷進行中的推理。評估涵蓋多個數據集，包括分類和推理任務，結果顯示 In-Writing 方法超越現有技術，在自然生成的基礎上實現高達 27% 的準確率提升。論文代碼已在 GitHub 上公開發布，由 Nokia-Bell-Labs 維護，促進進一步研究與應用。

來源

來源：Hugging Face / 論文來源

Hugging Face / 論文來源Thinking Before Constraining: A Unified Decoding Framework for Large Language Models