台湾交通大学提出新的360°图像深度估计框架,有效利用未标记360°数据
训练最先进深度估计模型的新方法
(映维网Nweon 2024年12月26日)准确估计360度图像的深度对于虚拟现和沉浸式媒体应用至关重要。现有的视角图像深度估计方法由于camera投影和畸变的不同而无法应用于360度图像,而360度图像深度估计方法由于缺乏标记数据对而性能较差。
针对所述问题,台湾交通大学的研究人员提出了一个新的深度估计框架,以有效地利用未标记的360度数据。
所述方法使用最先进的视角深度估计模型作为teacher模型,通过六面立方体投影技术生成伪标签,从而有效地标记360度图像的深度。这种方法利用了不断增加的大型数据集的可用性。
相关解决方案包括两个主要阶段:无效区域的离线掩码生成和在线半监督联合训练机制。团队在Matterport3D和Stanford2D3D等基准数据集测试了方法,并显示出深度估计精度的显著提高,特别是在zero-shot场景。
......(全文 1419 字,剩余 1108 字)
请微信扫码通过小程序阅读完整文章或者登入网站阅读完整文章
映维网会员可直接登入网站阅读
PICO员工可联系映维网免费获取权限