微软AR/VR专利分享基于优化的深度学习参数模型拟合
基于优化的深度学习参数模型拟合
(映维网Nweon 2023年11月10日)Landmark检测这项计算机视觉任务可以在图像和视频中检测和定位人脸或身体的关键点。
但由于可变性以及姿势和遮挡等诸多因素,Landmark检测具有挑战性。计算机视觉中的大多数任务都需要拟合参数模型来输入数据。但由于头戴式设备的位置和输入信号的稀疏性造成的自遮挡,从头戴式设备估计3D人体姿势是一个难题。
能够以准确、鲁棒和快速的方式将人体、手或脸的参数模型拟合到稀疏的输入信号中,这有望显著提高AR和VR场景的沉浸感。在处理所述问题的系统中,通常第一步是直接从输入数据回归参数模型的参数。但转换和优化系统以高性能运行需要定制实现,这需要工程师和领域专家投入大量时间。
对噪点输入数据拟合参数模型是计算机视觉中一个常见的任务。经典的优化方法可以通过迭代最小化手工制作的能量函数来紧密地拟合参数模型,但容易出现局部最小值。
......(全文 2059 字,剩余 1700 字)