返回事件流

知識圖譜增強的零樣本主題分類:多策略比較研究

研究論文探討了零樣本多標籤主題分類的挑戰,特別是當文件包含複雜關係資訊時。論文提出了一個零樣本多標籤主題分類框架,並系統地調查了每篇文章的知識圖譜增強對其性能的影響。基礎框架在沒有標記訓練數據的情況下對文件進行主題分類,具有四種變體:僅文章分類、關鍵詞增強分類,以及這兩種的自一致性解碼變體。然後,每種基礎變體都通過每篇文章的知識圖譜進行增強,該圖譜是通過類似KGGen的流水線從輸入文件中提取的,基於主語-謂語-賓語三元組。研究在十五個大型語言模型和八個不同領域的多標籤數據集上測試了所有八種方法。結果顯示,關鍵詞增強分類是基礎框架中表現最好的方法,並且十五個模型中有六個超越了句子編碼器基線。知識圖譜增強對小型和大型模型分別產生正面和負面影響,這表明大型模型已經從預訓練中包含了足夠的關係資訊。此外,自一致性解碼變體在任何實驗中都沒有顯示出性能提升,同時將計算成本增加了約五倍。研究結果提供了對零樣本分類中知識圖譜使用的深入見解,並為AI研究者提供了實用參考。

來源

來源:網頁來源