研究05/31 17:53

MVCHead模型無需多視圖數據生成3D高斯頭像

這項研究由Humansensinglab在HuggingFace平台上發布，介紹了MVCHead模型，這是一個單次拍攝的狀態空間模型，旨在從隨機採樣的2D圖像中學習條件和非條件3D頭模型，無需依賴多視圖數據、3D監督或中間視圖生成。模型核心是層級狀態空間(HiSS)塊，它逐步從粗到細地細化高斯體，同時捕捉長程依賴性。在每個HiSS塊內，研究修改了Mamba的標準單向掃描，提出了層級雙向狀態掃描(HiBiSS)，以對齊多視圖不一致性最強的軸。此外，設計了SE(3)多視圖評判器，用於判斷一組自我渲染是否來自單一基礎3D配置，從而獎勵跨視圖像素對齊，而無需觀察真實多視圖對。MVCHead在感知質量上達到最先進水平，在紋理和幾何一致性上超越先前方法，並保持可比較的形狀一致性。為展示可擴展性，研究發布了FaceGS-10K數據集，這是首個大規模的3D高斯頭像資產數據集，專門用於訓練和評估3D頭模型。

來源

來源：Hugging Face / 論文來源

Hugging Face / 論文來源Multi-view Consistent 3D Gaussian Head Avatars 'without' Multi-view Generation