微软研究团队分享：用数据集LaMAR开发AR场景定位、映射算法

编辑：刘余欣 | 分类：微软 / 论文 | 2022年10月27日

加入映维网会员

通过增加面部landmark的数量来实现更精确的3D面部重建

（映维网Nweon 2022年10月27日）计算机视觉是计算机科学中最引人注目的领域之一。它的发展速度非常迅速，并且有望显著影响人们的生活和工作方式。近年来，机器学习和计算机视觉的融合交叉进展正在加速，并为众多领域带来了重大进展，包括医疗保健、机器人、汽车工业和增强现实。

为了帮助人们实现更多目标，微软研究人员一直在与所述领域的学者和专家合作，共同开展一系列的计算机视觉项目。一个例子是PeopleLens。这款以HoloLens作为灵感的头戴式设备可以通过空间化音频识别周围的人员，从而帮助失明人士或视力低下人士在社交场合进行互动。另一个例子是Swin Transformer。这个计算机视觉架构在目标检测中实现了高精度，并提供了将计算机视觉和自然语言处理（NLP）架构统一的机遇。

在日前举行的2022年欧洲计算机视觉大会（ECCV），微软介绍了团队在计算机领域的最新成果。下面将重点与混合现实相关的两份研究论文。第一篇是通过增加面部landmark的数量来实现更精确的3D面部重建，在降低所需计算能力的同时获得最先进的结果。另一篇主要涉及一个利用AR设备对真实世界进行视觉定位和映射的数据集。以下是第二篇“LaMAR: Benchmarking Localization and Mapping for Augmented Reality”的分享。