挑战相机、人物同时移动，谷歌实现高质量3D深度信息重建，避免直接3D三角测量

编辑：广东客 | 分类：快讯 / 论文 | 2019年5月28日

加入映维网会员

查看引用和消息源请点击：映维网

用于深度预测的深度学习方法

（映维网 2019年05月28日）人类视觉系统非常强大，它能够根据二维投影理解我们的三维世界。即使是在具有多个移动对象的复杂环境中，人类都能够解释对象的几何形状和深度排序。长期以来，计算机视觉一直在研究如何通过从二维图像数据来计算重建场景几何，从而复刻人类的这项独特能力。但在大多数情况下，计算机视觉系统都难以实现稳定的重建。

当摄像头和场景对象都能自由移动时，这将变得特别具有挑战性。因为它会混淆基于三角测量的传统三维重建算法：它假设可以同时从至少两个不同的视点感知相同的对象。满足这个假设需要一个多摄像头阵列（如谷歌Jump）；或者需要场景保持静止，并且只有单个摄像头移动。因此，大多数现有方法要么是过滤掉移动对象（将它们指定为“零”深度值），要么忽略它们（导致不正确的深度值）。

挑战相机、人物同时移动，谷歌实现高质量3D深度信息重建，避免直接3D三角测量

在《Learning the Depths of Moving People by Watching Frozen People》这篇论文中，谷歌的研究团队应用了基于深度学习的解决方案。所述方法可以根据摄像头和对象都能自由移动的普通视频生成深度图，并且通过关于人体姿势与形状的机器学习来避免直接的3D三角测量。尽管业界近来已经开始利用机器学习进行深度预测，但谷歌表示，他们的研究是首个为摄像头和对象自由移动的情况而开发的深度学习方案。对于这项研究，谷歌主要专注于人类，因为它们适用于增强现实和3D视频效果。

......（全文 1558 字，剩余 1046 字）

请微信扫码通过小程序阅读完整文章
或者登入网站阅读完整文章
映维网会员可直接登入网站阅读
PICO员工可联系映维网免费获取权限