北京大学提出HoloDreamer，基于文本生成高质量3D场景

编辑：广东客 | 分类：论文 | 2025年1月14日

3D高斯飞溅

（映维网Nweon 2025年01月14日）诸如VR等领域对3D场景生成有着非常高的需求。由于文本到图像扩散模型的强大生成能力提供了可靠的先验，仅使用文本提示创建3D场景已经成为可能，从而大大推进了文生3D场景的研究。

为了从二维扩散模型中获得多视图监督，常用的方法通常是使用扩散模型生成初始局部图像，然后使用扩散模型迭代地绘制局部图像，逐渐生成场景。然而，这种基于outpainting的方法容易产生全局不一致的场景生成结果，没有高度的完整性，限制了它们的广泛应用。

为了解决这些问题，北京大学团队提出了HoloDreamer。这个框架首先生成高清全景作为完整3D场景的整体初始化，然后利用3D高斯飞溅快速重建3D场景，从而促进创建视图一致和的3D场景。

综合实验表明，在生成全封闭场景时，所述方法在整体视觉一致性和协调性以及重建质量和渲染鲁棒性方面优于先前的研究。

......（全文 1554 字，剩余 1226 字）

wx_mp

请微信扫码通过小程序阅读完整文章
或者登入网站阅读完整文章
映维网会员可直接登入网站阅读
PICO员工可联系映维网免费获取权限