研究06/03 24:12

聊天機器人預設哪些制度框架？審計多語言 LLM 的管轄權預設值

論文探討多語言大型語言模型（LLMs）在回答涉及稅務、勞工保護、醫療、教育、退休金及行政程序等問題時，如何處理管轄權適用性。由於實用性往往取決於相關司法管轄區，研究審計了七個在美國或中國開發的 LLMs，評估它們在提示未指定國家或地區時，是否將輸入語言作為預設管轄權信號。研究使用 60 個未指定管轄權的法律行政提示，以英語和普通話進行測試，涵蓋三種系統提示條件，共獲得 2,520 個手動標註的回應。結果顯示，中文輸入更常產生中國特定答案，而英文輸入更常產生美國特定、比較性或通用答案。具體而言，當提示要求單一答案時，74.5% 的英文輸入回應採用美國框架，而 53.3% 的中文輸入回應採用中國框架。這種方向性模式在所有七個模型中均出現。論文將此部署層級模式稱為『制度框架錯誤選擇風險』：流暢的答案可能依賴於用戶無意的法律行政上下文，尤其是當他們偏好的語言與相關管轄區不符時。研究建議 LLM 接口不應僅根據輸入語言來路由制度建議；當位置資訊缺失時，應要求提供或說明答案的管轄範圍。

來源

來源：網頁來源

網頁來源Which Institutional Frameworks Do Chatbots Assume? Auditing Jurisdictional Defaults in Multilingual LLMs