返回事件流

ImmigrationQA:美國移民法源數據集及小型模型適配

研究論文提出一個針對美國移民法的問答系統,背景是移民法涉及數千頁官方政策和聯邦法規,經常變更,對缺乏法律代理的申請人至關重要。團隊構建了ImmigrationQA數據集,包含17,058對問答,涵蓋13個子領域,並從多個來源如USCIS政策手冊和社區問答中提取文本塊。使用Claude Sonnet 4.6生成結構化問答對,拒絕了22對不匹配的樣本。他們微調了Llama 3.2 3B Instruct模型,採用LoRA參數高效方法。評估時,對993對測試集進行評分,微調模型平均得分1.08/3.0,相對基礎模型的0.85/3.0提升27%,但低於Claude Sonnet基線的1.52/3.0。模型在程序性子領域如旅行文件和非移民簽證方面改進明顯,但在複雜法律推理上較弱。整個流程雲計算成本約29美元,所有資源已公開發布。論文強調,系統不能替代法律諮詢,且不反映數據爬取後的法規變更。

來源

來源:網頁來源