苹果人工智能团队研发全新3D场景生成神经架构GAUDI
目前GAUDI生成的3D视频质量较低,并存在伪影,但这项技术为未来的可控生成AI系统,以及3D对象和场景渲染奠定了基础
(映维网Nweon 2022年08月05日)日前,苹果的人工智能团队亮相了全新的3D场景生成神经架构GAUDI(以西班牙著名建筑师安东尼奥·高迪/Antonio Gaudi的名字命名)。它可以捕捉复杂和逼真的3D场景分布,从移动camera执行沉浸式渲染,并基于文本提示创建3D场景。
将生成式人工智能扩展到完全无约束的3D场景依然是一个尚未解决的问题。其中一个原因是camera位置的限制。尽管对于单个对象来说,每一个可能的合理camera位置都可以映射到一个圆顶之上,但在3D场景中,camera位置会受到物体和墙壁等障碍物的限制。如果在场景生成过程中不考虑相关因素,生成的3D场景就无法使用。
苹果提出的GAUDI模型则通过三个专门的网络来解决这个问题:
......(全文 706 字,剩余 402 字)
请微信扫码通过小程序阅读完整文章或者登入网站阅读完整文章
映维网会员可直接登入网站阅读
PICO员工可联系映维网免费获取权限