研究06/02 12:06

多模型AI共識議定書：基於BFT的認知綜合協議

研究論文提出『共識議定書』，這是一種基於拜占庭容錯技術的架構，用於結構化的多模型人工智慧討論。該協議將模型間的分歧視為認知信號而非錯誤，並為語言模型分配工程化的認知角色，區分模型本質與推理方式。此外，論文引入了借鑒量化金融的樣本內/樣本外驗證框架，以區分訓練數據共識與經驗結論。實驗涵蓋1,478次討論會議，跨越10個領域類別的32個主題。結果顯示，認知角色而非底層模型決定了認知行為：低成本邊緣推理模型產生的分析輸出可與高成本前沿模型媲美。RLHF對齊訓練會創造可測量的領域特定認知盲點，例如在爭議性政策話題中，對抗性挑戰較少，且AI安全話題顯示不對稱偏差。議定書本身無方向性偏差，樣本外證據檢索驗證了239項聲明，並發現167個訓練數據討論中不可見的盲點。整個實驗成本僅為217美元，運行間再現性標準差平均為±2.2%。論文以MIT授權發布協議規範，以促進獨立驗證。

來源

來源：網頁來源

網頁來源Emergent Collaborative Deliberation in Multi-Model AI Systems: A BFT-Derived Protocol for Epistemic Synthesis