返回事件流

CobSeg:對話主題分割的連貫邊界建模

研究論文在arXiv上發布,提出CobSeg模型,專門處理對話主題分割任務。論文指出,在人類-AI協作應用中,對話主題分割至關重要,需要識別異質邊界提示,包括話語邊緣的詞彙轉換和跨話語的語義不連續性。然而,現有的話語模型常稀釋這些局部詞彙信號,導致邊界識別效果不佳。CobSeg採用新穎的多分支架構,將連貫級語義連續性與詞彙邊界轉換分離,並通過方向性邊界預測恢復兩者。模型進一步使用邊界信息性加權來強調高效用的話語位置,並融合語料庫衍生的主題連貫提示與學習的組合權重。在實驗評估中,CobSeg作為緊湊可訓練的分割器,在監督學習和自動誘導邊界的設置下均展現優異性能。特別是在本地詞彙提示突出的數據集如VHF上,在金標籤監督下,P_k指標降低0.7點,W_d降低0.6點;在DialSeg711數據集上達到P_k為1.0的水平。使用誘導邊界時,在VHF上P_k顯著降低14.8點,在DialSeg711和TIAGE上也分別降低1.5點和1.1點,超越先前非LLM方法。這表明CobSeg在無需調用大型語言模型的情況下,有效提升邊界預測準確度。

來源

來源:網頁來源