VESTA:視覺探索統計工具代理
研究論文提出 VESTA(Visual Exploration with Statistical Tool Agents)框架,旨在解決科學工作流程中量化模型擬合自動化不足的問題。傳統的基於代理的系統利用語言和視覺語言模型(VLMs)來迭代提出和優化統計模型,但在挑戰性任務上表現不佳。VESTA 透過為 VLMs 配備動態增長的探索工具箱來改進這一點,該工具箱通過數據轉換、假設驅動的可視化和穩健的統計測試來引導模型優化。與僅依賴迭代批評的先前系統不同,VESTA 在優化前後主動探索數據,選擇或創建診斷工具,這些工具在模型上下文中累積並可重複使用。論文引入 DAWN(Dataset for Automated Workflows and Numerical Modeling)基準測試,針對分佈擬合和時間序列建模,包含不同難度層級,最終應用於天文學任務如初始質量函數和引力波啁啾信號的建模。評估結果顯示,VESTA 的動態工具創建在複雜和特定領域任務上顯著優於現有代理管道。此外,動態生成的工具比現有視覺工具創建系統更為複雜,每個函數涵蓋更多診斷類別,並強烈偏好視覺輸出,以便 VLM 批評者可以直接推理。
來源
來源:網頁來源