苹果人工智能团队研发全新3D场景生成神经架构GAUDI

编辑：广东客 | 分类：苹果 / 论文 | 2022年8月5日

加入映维网会员

目前GAUDI生成的3D视频质量较低，并存在伪影，但这项技术为未来的可控生成AI系统，以及3D对象和场景渲染奠定了基础

Vision Pro QQ群交流：653565822

（映维网Nweon 2022年08月05日）日前，苹果的人工智能团队亮相了全新的3D场景生成神经架构GAUDI（以西班牙著名建筑师安东尼奥·高迪/Antonio Gaudi的名字命名）。它可以捕捉复杂和逼真的3D场景分布，从移动camera执行沉浸式渲染，并基于文本提示创建3D场景。

苹果人工智能团队研发全新3D场景生成神经架构GAUDI

将生成式人工智能扩展到完全无约束的3D场景依然是一个尚未解决的问题。其中一个原因是camera位置的限制。尽管对于单个对象来说，每一个可能的合理camera位置都可以映射到一个圆顶之上，但在3D场景中，camera位置会受到物体和墙壁等障碍物的限制。如果在场景生成过程中不考虑相关因素，生成的3D场景就无法使用。

苹果提出的GAUDI模型则通过三个专门的网络来解决这个问题：

......（全文 706 字，剩余 402 字）

请微信扫码通过小程序阅读完整文章
或者登入网站阅读完整文章
映维网会员可直接登入网站阅读
PICO员工可联系映维网免费获取权限