研究06/01 12:12

CobSeg：對話主題分割的連貫邊界建模

研究論文在arXiv上發布，提出CobSeg模型，專門處理對話主題分割任務。論文指出，在人類-AI協作應用中，對話主題分割至關重要，需要識別異質邊界提示，包括話語邊緣的詞彙轉換和跨話語的語義不連續性。然而，現有的話語模型常稀釋這些局部詞彙信號，導致邊界識別效果不佳。CobSeg採用新穎的多分支架構，將連貫級語義連續性與詞彙邊界轉換分離，並通過方向性邊界預測恢復兩者。模型進一步使用邊界信息性加權來強調高效用的話語位置，並融合語料庫衍生的主題連貫提示與學習的組合權重。在實驗評估中，CobSeg作為緊湊可訓練的分割器，在監督學習和自動誘導邊界的設置下均展現優異性能。特別是在本地詞彙提示突出的數據集如VHF上，在金標籤監督下，P_k指標降低0.7點，W_d降低0.6點；在DialSeg711數據集上達到P_k為1.0的水平。使用誘導邊界時，在VHF上P_k顯著降低14.8點，在DialSeg711和TIAGE上也分別降低1.5點和1.1點，超越先前非LLM方法。這表明CobSeg在無需調用大型語言模型的情況下，有效提升邊界預測準確度。

來源

來源：網頁來源

網頁來源CobSeg: Coherence Boundary Modeling for Dialogue Topic Segmentation