返回事件流

多代理 LLM 校準的反事實圖框架

研究論文提出 CAGE-CAL 框架,針對多代理大型語言模型系統進行可信度校準。多代理系統常將多數代理的共識視為可靠證據,但論文探討指出,代理間的通信可能導致相關故障和虛假共識,使得相同的投票份額在不同拓撲下反映不同的可靠度。CAGE-CAL 框架透過反事實分析,對每個查詢比較實際通信後的代理圖與匹配的無通信反事實圖,捕捉配對故障相關性和群體層級依賴性。不僅簡單計算同意代理數量,CAGE-CAL 估計觀測與無通信依賴性之間的反事實偏移,並相應調整可信度。在五個基準測試中,CAGE-CAL 提升了可靠度區分能力,並展現競爭性的預期校準誤差,其校準後的可信度進一步改善了拓撲選擇,優於最佳固定拓撲策略。

來源

來源:網頁來源