OpenAI研发全新从文本生成3D模型的系统Shap-E，大大提升速度

编辑：广东客 | 分类：论文 | 2023年5月17日

加入映维网会员

可以直接从文本描述中生成3D asset

（映维网Nweon 2023年05月17日）OpenAI在研究文本到三维对象方面取得了快速进展。已经托管至GitHub的Shap-E据称可以直接从文本描述中生成3D asset，或者从提供的图像中构建相关内容。

如果大家有印象，OpenAI早在2022年12月就发布了能够根据文本提示建立点云形式的基本3D模型的Point-E系统。

现在，团队又发布了速度大大增加的全新系统Shap-E。其中，它能够以 “隐式函数 “的形式建立模型，既可以呈现为纹理网格，又可以呈现为神经辐射场（NeRFs），即使用机器学习从二维图像中开发的三维模型。团队指出，尽管质量不及其他优化模型，但Shap-E的速度要快几个数量级，从而为用户提供了有利的权衡。

OpenAI研发全新从文本生成3D模型的系统Shap-E，大大提升速度

近来生成式图像模型的爆炸性增长，所以社区对训练其他类似模型的兴趣越来越大，如音频、视频和3D asset。大多数都适合于可以直接生成的自然的、固定大小的张量表示，例如图像的像素网格或音频的样本阵列。然而，如何以一种高效生成并易于在下游应用中实现的方式来表示3D asset是一个问题。

最近，隐性神经表征（INRs）已成为流行的3D asset编码方式。为了表示三维资产，INRs通常将3D坐标映射到特定的位置信息，如密度和颜色。一般来说，INRs独立于分辨率，因为它们可以在任意的输入点进行查询，而不是在一个固定的网格或序列中进行信息编码。由于它们是端到端的可微分，INRs能够实现各种下游应用，例如可微分的形状编辑。

......（全文 1389 字，剩余 884 字）

请微信扫码通过小程序阅读完整文章
或者登入网站阅读完整文章
映维网会员可直接登入网站阅读
PICO员工可联系映维网免费获取权限