研究06/03 24:44

3DCodeBench：通過代碼基準測試代理程序化 3D 建模

在 HuggingFace 平台上發布的研究論文中，作者提出 3DCodeBench，這是一個專為評估視覺語言模型（VLM）代理在 3D 建模軟件中進行程序化 3D 生成而設計的基準。程序化 3D 建模通過代碼實現，能提供確定性、引擎就緒且可精確編輯的資產，但傳統上需要深入的專業知識。3DCodeBench 評估了 12 個先進的 VLM 在將文本和圖像參考轉化為程序代碼方面的能力。為了解決自動指標可能無法完全捕捉 3D 形狀感知質量的問題，研究團隊建立了 3DCodeArena，這是一個基於人類偏好對生成的 3D 輸出進行排名的平台。從廣泛評估中，研究觀察到失敗大多源於 API 不匹配，而成功的渲染仍存在幾何組件不連接或漂浮的問題。測試時擴展技術，如提高思考預算和多輪優化，能整體提升性能。這些發現凸顯了對高質量程序編碼數據的關鍵需求，以推進商業 VLM 的發展。此外，有效的程序化 3D 建模需要一個穩健的執行環境，提供高保真反饋以進行迭代優化。論文釋放了 3DCodeBench 工具包，包括策劃的大規模多模態提示數據集、程序代碼、3D 對象三元組、評估協議以及公開的 3DCodeArena 平台，作為探索基於 VLM 的程序化 3D 建模器的基礎工具。

來源

來源：Hugging Face / 論文來源

Hugging Face / 論文來源3DCodeBench: Benchmarking Agentic Procedural 3D Modeling Via Code