返回事件流

TIGER:圖形證據路由減輕多模態生成幻覺

研究論文提出TIGER框架,旨在減輕多模態生成中的幻覺問題。傳統的修復方法在推理時生成反饋,但可能受到幻覺聲明的偏見影響。TIGER則獨立提取輸入的觀察圖和當前輸出的聲明圖,然後為每個聲明計算基於圖形的風險分數,以評估支持與衝突情況。框架修復選定的高風險聲明,同時保持模型骨幹凍結。論文還提供收斂分析,顯示在溫和假設下,預期總風險以幾何速率下降至明確的漸近界限。實驗涵蓋四種跨模態路徑:圖像到文本、圖像+文本到文本、音頻到文本和視頻到文本,結果表明TIGER能有效減少不支持內容,同時維持任務質量。此外,CrisisFACTS案例研究顯示,此修復機制可改善多源環境中的接地效果。

來源

來源:網頁來源