谷歌在CVPR2020分享最新AR/VR研究成果
最新的研究进展
(映维网 2020年06月18日)2020年计算机视觉和模式识别大会(Conference on Computer Vision and Pattern Recognition;CVPR)正在如火如荼地进行中,来自世界各地的计算机视觉研究者和工程师都在这里分享最新的进展。
对于今年的CVPR大会,谷歌人工智能团队共有近70份论文获得了收录,并介绍了在计算机视觉的一系列研究,包括对象映射与渲染,3D人类姿态生成,语义分割和透明对象关键点估计等等。

下面是或能用于增强现实/虚拟现实领域的论文及相关摘要整理:
1. Local Deep Implicit Functions for 3D Shape
这个项目的目标是通过深度摄像头视图推断来学习一个实现精确表面重建,紧凑存储,高效计算,相似形状一致性,以及不同形状类别归纳的3D形状表示。为此,我们引入了局部深隐函数(LDIF),一种将空间分解为一组结构化的学习隐函数的三维形状表示。我们提供从三维网格或姿势深度图像推断空间分解和局部深度隐式函数的网络。
2. GHUM & GHUML: Generative 3D Human Shape and Articulated Pose Models
我们在一个完全可训练的、模块化的深度学习框架内提出了一个活节3D人类建模管道。通过以各种姿势拍摄高分辨率的人体三维扫描,再加上头部和面部表情的特写镜头,以及手部关节,以及初步的、由艺术家设计的、性别中立的四边形网格,并且使用变分自编码、位姿空间变形校正、骨架关节中心预测器和混合蒙皮函数,我们在一个一致的学习循环中训练包括非线性形状空间在内的所有模型参数。所述模型与所有的三维动态扫描数据同时进行训练,从而获取相关性并确保各种组件的一致性。模型支持面部表情分析,以及身体(手部细节)形状和姿势估计。我们提供了完全可训练的,包含不同分辨率的通用人体模型,对它们进行了比较,分析了不同组件的影响,并用图像数据说明了它们的重建。
相关论文:GHUM & GHUML: Generative 3D Human Shape and Articulated Pose Models
3. Deep Homography Estimation for Dynamic Scenes
......(全文 1907 字,剩余 1255 字)


