研究06/01 12:09

診斷資源受限視覺代理中共享狀態協作的失敗模式

研究論文提出，模塊化視覺推理系統在多步協作中依賴共享工作記憶，但對於低容量模型中間狀態演化的失敗動態研究不足。論文透過噪聲累積的視角，研究弱學習器（4B至8B模型）的協作推理失敗模式。作者引入了 CoSee 審計框架，形式化讀取-寫入-驗證循環，以追踪文件視覺問答中的資訊流動。在多頁面、圖表和網頁基準測試中，研究發現了一個反直覺的退化：朴素的共享工作空間往往放大幻覺而非解決問題。論文識別出兩個主要失敗模式：噪聲強化，其中未接地點的筆記被重用為證據；以及策略崩潰，其中增加的上下文使模型轉向未指定、簡短形式的回答。透過成本-準確度帕累托前沿，研究表明增加計算可能與性能負相關，除非有明確驗證。研究結果表明，對於資源受限的代理，瓶頸不在於推理深度，而在於通訊保真度，提供了追踪級診斷和可靠模塊化設計的機械基調。

來源

來源：網頁來源

網頁來源Diagnosing Failure Modes of Shared-State Collaboration in Resource-Constrained Visual Agents