英語如何改寫本地知識:大型語言模型中的全球敘事主導
研究論文探討大型語言模型(LLMs)作為跨語言知識接口時的文化偏見問題。論文指出,當處理文化相關的問題時,LLMs 往往反映全球主導敘事,而非本地語境。以孟加拉語為低資源文化語境,研究引入名為 CulturalNB 的數據集,包含 717 個手動策劃的孟加拉文化實例,並提供平行的孟加拉-英語問答對、支持證據、元數據和社會文化註釋。研究使用問題-only 和基於證據的提示方法,評估九個 state-of-the-art LLMs,指標包括跨語言一致性、語言錨定、全球替代、機構偏見和知識視角覆蓋。結果發現,以英語提問會系統性地增加全球替代和機構框架,同時減少本地視角覆蓋。雖然本地證據能提高事實一致性和視角覆蓋,但無法完全消除語言引起的知識轉變。研究結論認為,LLMs 中的文化失敗不僅是知識缺失錯誤,還有基礎和敘事優先級的失敗。
來源
來源:網頁來源