研究06/01 12:12

多代理 LLM 校準的反事實圖框架

研究論文提出 CAGE-CAL 框架，針對多代理大型語言模型系統進行可信度校準。多代理系統常將多數代理的共識視為可靠證據，但論文探討指出，代理間的通信可能導致相關故障和虛假共識，使得相同的投票份額在不同拓撲下反映不同的可靠度。CAGE-CAL 框架透過反事實分析，對每個查詢比較實際通信後的代理圖與匹配的無通信反事實圖，捕捉配對故障相關性和群體層級依賴性。不僅簡單計算同意代理數量，CAGE-CAL 估計觀測與無通信依賴性之間的反事實偏移，並相應調整可信度。在五個基準測試中，CAGE-CAL 提升了可靠度區分能力，並展現競爭性的預期校準誤差，其校準後的可信度進一步改善了拓撲選擇，優於最佳固定拓撲策略。

來源

來源：網頁來源

網頁來源Counterfactual Graph for Multi-Agent LLM Calibration