研究06/03 24:08

VESTA：視覺探索統計工具代理

研究論文提出 VESTA（Visual Exploration with Statistical Tool Agents）框架，旨在解決科學工作流程中量化模型擬合自動化不足的問題。傳統的基於代理的系統利用語言和視覺語言模型（VLMs）來迭代提出和優化統計模型，但在挑戰性任務上表現不佳。VESTA 透過為 VLMs 配備動態增長的探索工具箱來改進這一點，該工具箱通過數據轉換、假設驅動的可視化和穩健的統計測試來引導模型優化。與僅依賴迭代批評的先前系統不同，VESTA 在優化前後主動探索數據，選擇或創建診斷工具，這些工具在模型上下文中累積並可重複使用。論文引入 DAWN（Dataset for Automated Workflows and Numerical Modeling）基準測試，針對分佈擬合和時間序列建模，包含不同難度層級，最終應用於天文學任務如初始質量函數和引力波啁啾信號的建模。評估結果顯示，VESTA 的動態工具創建在複雜和特定領域任務上顯著優於現有代理管道。此外，動態生成的工具比現有視覺工具創建系統更為複雜，每個函數涵蓋更多診斷類別，並強烈偏好視覺輸出，以便 VLM 批評者可以直接推理。

來源

來源：網頁來源

網頁來源VESTA: Visual Exploration with Statistical Tool Agents