北京大学提出HoloDreamer,基于文本生成高质量3D场景

查看引用/信息源请点击:映维网Nweon

3D高斯飞溅

映维网Nweon 2025年01月14日)诸如VR等领域对3D场景生成有着非常高的需求。由于文本到图像扩散模型的强大生成能力提供了可靠的先验,仅使用文本提示创建3D场景已经成为可能,从而大大推进了文生3D场景的研究。

为了从二维扩散模型中获得多视图监督,常用的方法通常是使用扩散模型生成初始局部图像,然后使用扩散模型迭代地绘制局部图像,逐渐生成场景。然而,这种基于outpainting的方法容易产生全局不一致的场景生成结果,没有高度的完整性,限制了它们的广泛应用。

为了解决这些问题,北京大学团队提出了HoloDreamer。这个框架首先生成高清全景作为完整3D场景的整体初始化,然后利用3D高斯飞溅快速重建3D场景,从而促进创建视图一致和的3D场景。

综合实验表明,在生成全封闭场景时,所述方法在整体视觉一致性和协调性以及重建质量和渲染鲁棒性方面优于先前的研究。

......(全文 1554 字,剩余 1226 字)


请微信扫码通过小程序阅读完整文章
或者登入网站阅读完整文章
映维网会员可直接登入网站阅读
PICO员工可联系映维网免费获取权限

本文链接https://news.nweon.com/127040
转载须知:转载摘编需注明来源映维网并保留本文链接
素材版权:除额外说明,文章所用图片、视频均来自文章关联个人、企业实体等提供
QQ交流群苹果Vision  |  Meta Quest  |  微软HoloLens  |  AR/VR开发者  |  映维粉丝读者
资讯