返回事件流

多模型AI共識議定書:基於BFT的認知綜合協議

研究論文提出『共識議定書』,這是一種基於拜占庭容錯技術的架構,用於結構化的多模型人工智慧討論。該協議將模型間的分歧視為認知信號而非錯誤,並為語言模型分配工程化的認知角色,區分模型本質與推理方式。此外,論文引入了借鑒量化金融的樣本內/樣本外驗證框架,以區分訓練數據共識與經驗結論。實驗涵蓋1,478次討論會議,跨越10個領域類別的32個主題。結果顯示,認知角色而非底層模型決定了認知行為:低成本邊緣推理模型產生的分析輸出可與高成本前沿模型媲美。RLHF對齊訓練會創造可測量的領域特定認知盲點,例如在爭議性政策話題中,對抗性挑戰較少,且AI安全話題顯示不對稱偏差。議定書本身無方向性偏差,樣本外證據檢索驗證了239項聲明,並發現167個訓練數據討論中不可見的盲點。整個實驗成本僅為217美元,運行間再現性標準差平均為±2.2%。論文以MIT授權發布協議規範,以促進獨立驗證。

來源

來源:網頁來源