OpenAI研发全新从文本生成3D模型的系统Shap-E,大大提升速度
可以直接从文本描述中生成3D asset
(映维网Nweon 2023年05月17日)OpenAI在研究文本到三维对象方面取得了快速进展。已经托管至GitHub的Shap-E据称可以直接从文本描述中生成3D asset,或者从提供的图像中构建相关内容。
如果大家有印象,OpenAI早在2022年12月就发布了能够根据文本提示建立点云形式的基本3D模型的Point-E系统。
现在,团队又发布了速度大大增加的全新系统Shap-E。其中,它能够以 “隐式函数 “的形式建立模型,既可以呈现为纹理网格,又可以呈现为神经辐射场(NeRFs),即使用机器学习从二维图像中开发的三维模型。团队指出,尽管质量不及其他优化模型,但Shap-E的速度要快几个数量级,从而为用户提供了有利的权衡。
近来生成式图像模型的爆炸性增长,所以社区对训练其他类似模型的兴趣越来越大,如音频、视频和3D asset。大多数都适合于可以直接生成的自然的、固定大小的张量表示,例如图像的像素网格或音频的样本阵列。然而,如何以一种高效生成并易于在下游应用中实现的方式来表示3D asset是一个问题。
最近,隐性神经表征(INRs)已成为流行的3D asset编码方式。为了表示三维资产,INRs通常将3D坐标映射到特定的位置信息,如密度和颜色。一般来说,INRs独立于分辨率,因为它们可以在任意的输入点进行查询,而不是在一个固定的网格或序列中进行信息编码。由于它们是端到端的可微分,INRs能够实现各种下游应用,例如可微分的形状编辑。
......(全文 1389 字,剩余 884 字)
请微信扫码通过小程序阅读完整文章或者登入网站阅读完整文章
映维网会员可直接登入网站阅读
PICO员工可联系映维网免费获取权限