谷歌最新AR/VR专利提出单个RGBD摄像头进行体三维捕捉
利用单个RGBD摄像头对对象进行体三维捕捉的方法和系统
(映维网 2020年11月09日)复杂的捕获设备可用于生成非常高质量的人类体三维重建。这种系统主要依靠昂贵的高端基础设施来处理捕获的大量数据。由于每帧需要数分钟的计算时间,所以当前的技术不适合实时应用。
关于“volumetric”翻译:
volumetric是volume的变形,主要含义指“体积”,是一种“体积”上度量。行业常见翻译“容积”是一种错误的翻译,映维网也曾错误用过。“容积(容量)”在英语中一般用 capacity 来表达,而不是用volume 。
假设一个金字塔体积是A,内部容量(容积)是B,金字塔墙壁的体积是C,则A=B+C。如果对该金字塔进行volumetric度量,那结果是跟A相关的,但如果翻译成“容积”结果就是跟B相关,所以用“容积”是不对的。一个物体有体积,但不一定有容积。 在计算机里,volumetric指三维立体上的度量,相关词组映维网最早在2015年翻译成“体式/体式三维/体式视频”等,后经多次反复研究论证后,统一简化成更恰当直观的“体三维”,也更有专业术语的味道。
另一种进行人类体三维重建的方法是将实时非刚性融合管道扩展到多视图捕获设置中。然而,相关的结果存在几何失真、纹理质量差和光照不准确等问题,难以达到增强现实/虚拟现实应用所要求的质量水平。
针对这个问题,谷歌正在积极探索可行的实时解决方案。

美国专利商标局日前公布了一份名为“Volumetric Capture Of Objects With A Single Rgbd Camera”的专利申请。其中,谷歌描述了一种利用单个RGBD摄像头对对象进行体三维捕捉的方法和系统。
在一个实施例中,一种方法包括使用单个RGBD摄像头接收包括颜色数据和深度数据的第一图像;确定与显示第二图像的增强现实和/或虚拟现实显示器相关联的视点;接收包括第一图像中的对象的至少一个校准图像;并且根据所述第一图像、所述视点和所述至少一个校准图像生成第二图像。
......(全文 1511 字,剩余 857 字)


