微软研究团队分享:用数据集LaMAR开发AR场景定位、映射算法
通过增加面部landmark的数量来实现更精确的3D面部重建
(映维网Nweon 2022年10月27日)计算机视觉是计算机科学中最引人注目的领域之一。它的发展速度非常迅速,并且有望显著影响人们的生活和工作方式。近年来,机器学习和计算机视觉的融合交叉进展正在加速,并为众多领域带来了重大进展,包括医疗保健、机器人、汽车工业和增强现实。
为了帮助人们实现更多目标,微软研究人员一直在与所述领域的学者和专家合作,共同开展一系列的计算机视觉项目。一个例子是PeopleLens。这款以HoloLens作为灵感的头戴式设备可以通过空间化音频识别周围的人员,从而帮助失明人士或视力低下人士在社交场合进行互动。另一个例子是Swin Transformer。这个计算机视觉架构在目标检测中实现了高精度,并提供了将计算机视觉和自然语言处理(NLP)架构统一的机遇。
在日前举行的2022年欧洲计算机视觉大会(ECCV),微软介绍了团队在计算机领域的最新成果。下面将重点与混合现实相关的两份研究论文。第一篇是通过增加面部landmark的数量来实现更精确的3D面部重建,在降低所需计算能力的同时获得最先进的结果。另一篇主要涉及一个利用AR设备对真实世界进行视觉定位和映射的数据集。以下是第二篇“LaMAR: Benchmarking Localization and Mapping for Augmented Reality”的分享。
延伸阅读:微软研究团队分享:增加面部landmark数量实现更精确3D面部重建
......(全文 2167 字,剩余 1681 字)
请微信扫码通过小程序阅读完整文章或者登入网站阅读完整文章
映维网会员可直接登入网站阅读
PICO员工可联系映维网免费获取权限