返回事件流

診斷資源受限視覺代理中共享狀態協作的失敗模式

研究論文提出,模塊化視覺推理系統在多步協作中依賴共享工作記憶,但對於低容量模型中間狀態演化的失敗動態研究不足。論文透過噪聲累積的視角,研究弱學習器(4B至8B模型)的協作推理失敗模式。作者引入了 CoSee 審計框架,形式化讀取-寫入-驗證循環,以追踪文件視覺問答中的資訊流動。在多頁面、圖表和網頁基準測試中,研究發現了一個反直覺的退化:朴素的共享工作空間往往放大幻覺而非解決問題。論文識別出兩個主要失敗模式:噪聲強化,其中未接地點的筆記被重用為證據;以及策略崩潰,其中增加的上下文使模型轉向未指定、簡短形式的回答。透過成本-準確度帕累托前沿,研究表明增加計算可能與性能負相關,除非有明確驗證。研究結果表明,對於資源受限的代理,瓶頸不在於推理深度,而在於通訊保真度,提供了追踪級診斷和可靠模塊化設計的機械基調。

來源

來源:網頁來源