聊天機器人預設哪些制度框架?審計多語言 LLM 的管轄權預設值
論文探討多語言大型語言模型(LLMs)在回答涉及稅務、勞工保護、醫療、教育、退休金及行政程序等問題時,如何處理管轄權適用性。由於實用性往往取決於相關司法管轄區,研究審計了七個在美國或中國開發的 LLMs,評估它們在提示未指定國家或地區時,是否將輸入語言作為預設管轄權信號。研究使用 60 個未指定管轄權的法律行政提示,以英語和普通話進行測試,涵蓋三種系統提示條件,共獲得 2,520 個手動標註的回應。結果顯示,中文輸入更常產生中國特定答案,而英文輸入更常產生美國特定、比較性或通用答案。具體而言,當提示要求單一答案時,74.5% 的英文輸入回應採用美國框架,而 53.3% 的中文輸入回應採用中國框架。這種方向性模式在所有七個模型中均出現。論文將此部署層級模式稱為『制度框架錯誤選擇風險』:流暢的答案可能依賴於用戶無意的法律行政上下文,尤其是當他們偏好的語言與相關管轄區不符時。研究建議 LLM 接口不應僅根據輸入語言來路由制度建議;當位置資訊缺失時,應要求提供或說明答案的管轄範圍。
來源
來源:網頁來源