Facebook开源3D识别训练工具3DETR、DepthContrast
3DETR和DepthContrast
(映维网 2021年10月28日)使用大型标记数据集进行预训练已成为开发高性能计算机视觉模型的核心工具。不过,尽管这种方法适用于多种类型的媒介,但它尚未广泛用于3D识别任务,例如在客厅的3D扫描中识别和定位沙发。
这是由于缺少带注释的数据,以及标记3D数据集非常耗时。另外,用于3D理解的模型通常依赖于与特定3D数据集紧密耦合的人工架构设计。
针对这个问题,Facebook人工智能团队将在国际计算机视觉2021大会介绍3DETR和DepthContrast。这是两种互补的新模型,能够促进对3D的理解,并大大简化了入门开始。通过建立一个简化3D理解的通用3D架构,并通过一种不需要标签的自我监督学习方法,研究人员希望能够解决上述的常见挑战。
同时,Facebook人工智能团队宣布将向开源社区提供这项研究和相关代码。
1. 为机器理解世界解锁一种强大的新方式
出于一系列的原因,打造能够理解世界3D数据的机器非常重要。自动驾驶汽车需要3D理解以实现移动和避免撞到障碍物,而AR/VR应用则可以帮助人们完成各种任务,例如可视化沙发是否适合客厅。
......(全文 2485 字,剩余 2099 字)
请微信扫码通过小程序阅读完整文章或者登入网站阅读完整文章
映维网会员可直接登入网站阅读
PICO员工可联系映维网免费获取权限