微软研究团队分享:增加面部landmark数量实现更精确3D面部重建

PICO 4 Ultra

查看引用/信息源请点击:映维网Nweon

通过增加面部landmark的数量来实现更精确的3D面部重建

映维网Nweon 2022年10月26日)计算机视觉是计算机科学中最引人注目的领域之一。它的发展速度非常迅速,并且有望显著影响人们的生活和工作方式。近年来,机器学习和计算机视觉的融合交叉进展正在加速,并为众多领域带来了重大进展,包括医疗保健、机器人、汽车工业和增强现实。

为了帮助人们实现更多目标,微软研究人员一直在与所述领域的学者和专家合作,共同开展一系列的计算机视觉项目。一个例子是PeopleLens。这款以HoloLens作为灵感的头戴式设备可以通过空间化音频识别周围的人员,从而帮助失明人士或视力低下人士在社交场合进行互动。另一个例子是Swin Transformer。这个计算机视觉架构在目标检测中实现了高精度,并提供了将计算机视觉和自然语言处理(NLP)架构统一的机遇。

在日前举行的2022年欧洲计算机视觉大会(ECCV),微软介绍了团队在计算机领域的最新成果。下面将重点与混合现实相关的两份研究论文。第一篇是通过增加面部landmark的数量来实现更精确的3D面部重建,在降低所需计算能力的同时获得最先进的结果。另一篇主要涉及一个利用AR设备对真实世界进行视觉定位和映射的数据集。以下是第一篇“3D face reconstruction with dense landmarks”的分享。

延伸阅读微软研究团队分享:用数据集LaMAR开发AR场景定位、映射算法

1. 方法介绍

Landmark通常在人脸分析中起着关键作用,但关于身份或表情的众多方面无法仅用稀疏Landmark来进行表示。为了更精确地重建人脸,行业通常将Landmark与深度图像等附加信号或微分渲染等技术相结合。

通常,从业者用来训练ML模型的公共数据集包含68个面部Landmark的注释。然而,人脸并不能仅用68个Landmark来精确地表示,需要额外的方法来补充Landmark检测,而这增加了训练工作的复杂性,并增加了所需的计算能力。

所以,研究人员好奇的一个问题是:为了进一步简化流程和优化资源利用,是否可以单纯依靠(密集)Landmark来实现逼真的人脸重建呢?

......(全文 1829 字,剩余 1132 字)

wx_mp

请微信扫码通过小程序阅读完整文章或者登入网站阅读完整文章
映维网会员可直接登入网站阅读
PICO员工可联系映维网免费获取权限

本文链接https://news.nweon.com/101929
转载须知:转载摘编需注明来源映维网并保留本文链接
素材版权:除额外说明,文章所用图片、视频均来自文章关联个人、企业实体等提供
QQ交流群苹果Vision  |  Meta Quest  |  AR/VR开发者  |  映维粉丝读者
XR Research Wechat Group/微信群

您可能还喜欢...

资讯