優先識別結構而非複雜模型以進行科學發現
研究論文提出,在當代科學研究中,機器學習與人工智慧模型,尤其是大型語言模型,日益被用來從觀測數據生成科學假說和機制性解釋。然而,論文指出,在現代機器學習擅長的高維代理環境中,機制學習普遍存在不確定性:許多不相容的機制本質上會誘發數據支持上的相同觀測關係,因此預測成功與連貫解釋不足以作為機制發現的證據。這種不確定性在大型語言模型中尤為危險,因為它們傾向於將大規模的等價解釋類別壓縮成單一流暢的敘事。為此,論文提出了具體的「機制機器學習」標準,認為這些規範是必要的,以確保以大型語言模型為中心的工作流程能夠支持科學發展,而非僅僅模擬科學過程。通過優先識別結構而非複雜模型,科學發現可以更可靠地進行。
來源
來源:網頁來源