IdiomX:多語言成語理解、檢索與解讀基準發布
研究論文提出 IdiomX,這是一個大規模多語言基準,專門用於成語理解、檢索和解讀。論文指出,成語表達在自然語言處理中一直是個持續挑戰,因為其意義往往非組合性、依賴上下文且難以跨語言對齊。現有的成語資源在規模、上下文多樣性或多語言覆蓋方面常有限制,無法充分支援現代語言模型。為此,作者透過一個可再現的多階段流程構建 IdiomX,結合詞彙資源提取、大規模標準化、受控大型語言模型增強和結構化驗證。最終數據集包含超過 19 萬個上下文化例子,涵蓋超過 1.2 萬個成語,並具有對齊的英文、阿拉伯文和法文語義表示、成語與字面用法標籤以及豐富的語言元資料。基於此資源,論文定義了一個統一的四任務基準,涵蓋成語偵測、上下文到成語檢索、阿拉伯文到英文成語檢索以及成語解讀,將評估從比喻識別擴展到語義基礎和可解釋意義檢索。實驗顯示,上下文變換器模型大幅改善了成語偵測,而混合檢索和重排序架構則顯著增強了單語和跨語言成語檢索。結果進一步證明,成語解讀可以有效建模為語義檢索任務,將可解釋性作為基準的補充維度。整體而言,IdiomX 提供了一個可擴展的基準,用於研究成語語言作為從偵測到檢索再到語義解讀的進程,並提供了一個模組化框架,可擴展到其他語言和比喻推理任務。
來源
來源:網頁來源