丹麦技术大学开发Weak Cube R-CNN 仅需2D标注实现3D物体检测
弱监督的3D检测
(映维网Nweon 2025年07月28日)单目三维目标检测是计算机视觉中的一项重要任务,在虚拟现实和增强现实等领域有着广泛的应用。然而,3D目标检测器通常以完全监督的方式进行训练,广泛依赖于3D标记数据,而这是一种劳动密集型且昂贵的注释。
在一项研究中,丹麦技术大学团队把目光放在弱监督的3D检测,以减少数据需求,并使用单目方法,利用单摄像头系统,而不是昂贵的激光雷达传感器或多摄像头设置。
研究人员提出了一种通用模型Weak Cube R-CNN,它利用三维立方体的二维投影之间的关系,只需要二维方框注释进行训练,就可以在推理时预测三维对象。所提出方法利用预训练的frozen foundation 2D模型来估计训练集的深度和方向信息,并在训练中使用估计值作为pseudo-ground truth。所设计的损失函数通过将外部模型的信息整合到损失中来避免3D标签。
通过这种方式,团队的目标是隐式地从large foundation 2D模型中转移knowledge,而无需访问3D边界框注释。在SUN RGB-D数据集的实验结果表明,与标注时间均衡的Cube R-CNN基线相比,准确度有所提高。尽管对厘米级测量不精确,但所述方法为进一步的研究提供了坚实的基础。
......(全文 2286 字,剩余 1869 字)
请微信扫码通过小程序阅读完整文章或者登入网站阅读完整文章
映维网会员可直接登入网站阅读
PICO员工可联系映维网免费获取权限