研究06/04 24:43

IdiomX：多語言成語理解、檢索與解讀基準發布

研究論文提出 IdiomX，這是一個大規模多語言基準，專門用於成語理解、檢索和解讀。論文指出，成語表達在自然語言處理中一直是個持續挑戰，因為其意義往往非組合性、依賴上下文且難以跨語言對齊。現有的成語資源在規模、上下文多樣性或多語言覆蓋方面常有限制，無法充分支援現代語言模型。為此，作者透過一個可再現的多階段流程構建 IdiomX，結合詞彙資源提取、大規模標準化、受控大型語言模型增強和結構化驗證。最終數據集包含超過 19 萬個上下文化例子，涵蓋超過 1.2 萬個成語，並具有對齊的英文、阿拉伯文和法文語義表示、成語與字面用法標籤以及豐富的語言元資料。基於此資源，論文定義了一個統一的四任務基準，涵蓋成語偵測、上下文到成語檢索、阿拉伯文到英文成語檢索以及成語解讀，將評估從比喻識別擴展到語義基礎和可解釋意義檢索。實驗顯示，上下文變換器模型大幅改善了成語偵測，而混合檢索和重排序架構則顯著增強了單語和跨語言成語檢索。結果進一步證明，成語解讀可以有效建模為語義檢索任務，將可解釋性作為基準的補充維度。整體而言，IdiomX 提供了一個可擴展的基準，用於研究成語語言作為從偵測到檢索再到語義解讀的進程，並提供了一個模組化框架，可擴展到其他語言和比喻推理任務。

來源

來源：網頁來源

網頁來源IdiomX A Multilingual Benchmark for Idiom Understanding, Retrieval, and Interpretation