研究06/02 12:07

TIGER：圖形證據路由減輕多模態生成幻覺

研究論文提出TIGER框架，旨在減輕多模態生成中的幻覺問題。傳統的修復方法在推理時生成反饋，但可能受到幻覺聲明的偏見影響。TIGER則獨立提取輸入的觀察圖和當前輸出的聲明圖，然後為每個聲明計算基於圖形的風險分數，以評估支持與衝突情況。框架修復選定的高風險聲明，同時保持模型骨幹凍結。論文還提供收斂分析，顯示在溫和假設下，預期總風險以幾何速率下降至明確的漸近界限。實驗涵蓋四種跨模態路徑：圖像到文本、圖像+文本到文本、音頻到文本和視頻到文本，結果表明TIGER能有效減少不支持內容，同時維持任務質量。此外，CrisisFACTS案例研究顯示，此修復機制可改善多源環境中的接地效果。

來源

來源：網頁來源

網頁來源TIGER: Traceable Inference with Graph-Based Evidence Routing for Mitigating Hallucinations in Multimodal Generation