研究06/04 01:37

優先識別結構而非複雜模型以進行科學發現

研究論文提出，在當代科學研究中，機器學習與人工智慧模型，尤其是大型語言模型，日益被用來從觀測數據生成科學假說和機制性解釋。然而，論文指出，在現代機器學習擅長的高維代理環境中，機制學習普遍存在不確定性：許多不相容的機制本質上會誘發數據支持上的相同觀測關係，因此預測成功與連貫解釋不足以作為機制發現的證據。這種不確定性在大型語言模型中尤為危險，因為它們傾向於將大規模的等價解釋類別壓縮成單一流暢的敘事。為此，論文提出了具體的「機制機器學習」標準，認為這些規範是必要的，以確保以大型語言模型為中心的工作流程能夠支持科學發展，而非僅僅模擬科學過程。通過優先識別結構而非複雜模型，科學發現可以更可靠地進行。

來源

來源：網頁來源

網頁來源Position: Prioritize Identifying Structure, Not Complex Models, for Scientific Discovery