3DCodeBench:通過代碼基準測試代理程序化 3D 建模
在 HuggingFace 平台上發布的研究論文中,作者提出 3DCodeBench,這是一個專為評估視覺語言模型(VLM)代理在 3D 建模軟件中進行程序化 3D 生成而設計的基準。程序化 3D 建模通過代碼實現,能提供確定性、引擎就緒且可精確編輯的資產,但傳統上需要深入的專業知識。3DCodeBench 評估了 12 個先進的 VLM 在將文本和圖像參考轉化為程序代碼方面的能力。為了解決自動指標可能無法完全捕捉 3D 形狀感知質量的問題,研究團隊建立了 3DCodeArena,這是一個基於人類偏好對生成的 3D 輸出進行排名的平台。從廣泛評估中,研究觀察到失敗大多源於 API 不匹配,而成功的渲染仍存在幾何組件不連接或漂浮的問題。測試時擴展技術,如提高思考預算和多輪優化,能整體提升性能。這些發現凸顯了對高質量程序編碼數據的關鍵需求,以推進商業 VLM 的發展。此外,有效的程序化 3D 建模需要一個穩健的執行環境,提供高保真反饋以進行迭代優化。論文釋放了 3DCodeBench 工具包,包括策劃的大規模多模態提示數據集、程序代碼、3D 對象三元組、評估協議以及公開的 3DCodeArena 平台,作為探索基於 VLM 的程序化 3D 建模器的基礎工具。
來源
來源:Hugging Face / 論文來源
- Hugging Face / 論文來源3DCodeBench: Benchmarking Agentic Procedural 3D Modeling Via Code