丹麦技术大学开发Weak Cube R-CNN 仅需2D标注实现3D物体检测

PICO 4 Ultra

查看引用/信息源请点击:映维网Nweon

弱监督的3D检测

映维网Nweon 2025年07月28日)单目三维目标检测是计算机视觉中的一项重要任务,在虚拟现实和增强现实等领域有着广泛的应用。然而,3D目标检测器通常以完全监督的方式进行训练,广泛依赖于3D标记数据,而这是一种劳动密集型且昂贵的注释。

在一项研究中,丹麦技术大学团队把目光放在弱监督的3D检测,以减少数据需求,并使用单目方法,利用单摄像头系统,而不是昂贵的激光雷达传感器或多摄像头设置。

研究人员提出了一种通用模型Weak Cube R-CNN,它利用三维立方体的二维投影之间的关系,只需要二维方框注释进行训练,就可以在推理时预测三维对象。所提出方法利用预训练的frozen foundation 2D模型来估计训练集的深度和方向信息,并在训练中使用估计值作为pseudo-ground truth。所设计的损失函数通过将外部模型的信息整合到损失中来避免3D标签。

通过这种方式,团队的目标是隐式地从large foundation 2D模型中转移knowledge,而无需访问3D边界框注释。在SUN RGB-D数据集的实验结果表明,与标注时间均衡的Cube R-CNN基线相比,准确度有所提高。尽管对厘米级测量不精确,但所述方法为进一步的研究提供了坚实的基础。

......(全文 2286 字,剩余 1869 字)


请微信扫码通过小程序阅读完整文章
或者登入网站阅读完整文章
映维网会员可直接登入网站阅读
PICO员工可联系映维网免费获取权限

本文链接https://news.nweon.com/131298
转载须知:转载摘编需注明来源映维网并保留本文链接
素材版权:除额外说明,文章所用图片、视频均来自文章关联个人、企业实体等提供
QQ交流群苹果Vision  |  Meta Quest  |  AR/VR开发者  |  映维粉丝读者
XR 招聘Job
XR Research Wechat Group/微信群
资讯