丹麦技术大学开发Weak Cube R-CNN 仅需2D标注实现3D物体检测

编辑：广东客 | 分类：论文 | 2025年7月28日

加入映维网会员

弱监督的3D检测

（映维网Nweon 2025年07月28日）单目三维目标检测是计算机视觉中的一项重要任务，在虚拟现实和增强现实等领域有着广泛的应用。然而，3D目标检测器通常以完全监督的方式进行训练，广泛依赖于3D标记数据，而这是一种劳动密集型且昂贵的注释。

在一项研究中，丹麦技术大学团队把目光放在弱监督的3D检测，以减少数据需求，并使用单目方法，利用单摄像头系统，而不是昂贵的激光雷达传感器或多摄像头设置。

研究人员提出了一种通用模型Weak Cube R-CNN，它利用三维立方体的二维投影之间的关系，只需要二维方框注释进行训练，就可以在推理时预测三维对象。所提出方法利用预训练的frozen foundation 2D模型来估计训练集的深度和方向信息，并在训练中使用估计值作为pseudo-ground truth。所设计的损失函数通过将外部模型的信息整合到损失中来避免3D标签。

通过这种方式，团队的目标是隐式地从large foundation 2D模型中转移knowledge，而无需访问3D边界框注释。在SUN RGB-D数据集的实验结果表明，与标注时间均衡的Cube R-CNN基线相比，准确度有所提高。尽管对厘米级测量不精确，但所述方法为进一步的研究提供了坚实的基础。

......（全文 2286 字，剩余 1869 字）

请微信扫码通过小程序阅读完整文章
或者登入网站阅读完整文章
映维网会员可直接登入网站阅读
PICO员工可联系映维网免费获取权限