Traj-Evolve:肺癌早期檢測的自我演化多代理系統
研究論文提出了一個名為 Traj-Evolve 的自我演化多代理系統,專門應用於肺癌早期檢測中的患者軌跡建模。現有的基於大型語言模型的多代理系統雖然處理了上下文長度問題,但通常是孤立地處理患者數據,未能模仿臨床醫生從相似先前案例中累積經驗的方式。Traj-Evolve 通過兩個互補的演化機制來解決這一問題:首先,經驗池(ExPool)作為一個非參數記憶,索引經過拒絕採樣的推理軌跡,以檢索相似患者作為少量示例上下文;其次,多代理強化學習(MARL)通過獎勵排序微調來參數化優化代理之間以及代理與記憶之間的協作。論文在肺癌預測任務中評估了該系統,利用長達五年的多模態電子健康紀錄,結果顯示 Traj-Evolve 在總體人群和具有挑戰性的非吸煙人群上均優於九個強基線。演化動態分析揭示了三個關鍵發現:擴展經驗池將最佳檢索從多樣樣本轉向特定樣本;在多代理強化學習下,管理代理的預測損失快速收斂,而工作代理的時序推理持續受益於更多驗證患者;兩個機制在預測風險上互補,經驗池提高特異性,多代理強化學習提高敏感性。
來源
來源:網頁來源