雨果·巴拉:行业北极星Vision Pro过度设计不适合产品市场

SLAM是如何改变增强现实技术的?

文章相关引用及参考:映维网

当这两种不同的交互方式开始无缝融合的时候,我相信我们会看到最强大和最广泛采用的增强现实实现。

映维网 2018年01月18日)尽管普及率有限,但增强现实显然是当前最热门的技术领域之一。这在很大程度上是因为通过标记追踪来实现AR传统方式,以及随之而来的高门槛障碍。

1. 图像识别与标记追踪

除了3D模型和动画之外,增强现实的支点是建立在两个紧密相关的技术上:图像识别与标记追踪。当两者配对在一起时,它们可以支持摄像头识别图像的数据,从而触发相关的体验并在三维空间中追踪相对于摄像头的眼睛位置。通过将图像上传至处理服务器,开发者可以将一个或多个图像关联到单个增强现实体验。这样,设备上的摄像头就能够理解并追踪叠加的数字内容。

对于其工作原理,我们首先要理解两个核心概念。首先是Marker Detection(标记检测),即通过相机镜头识别图像(通常称为标记),并且与服务器上的对应部分建立关联以触发体验;其次是Marker Tracking(标记追踪),或者说能够维持物理对象或标记的实时方向,并且不断更新数字内容以模拟它的能力。

一个基于标记的AR体验的例子

检测和追踪的质量由一系列的参数决定,主要是对比点的复杂度和标记所缺乏的重复模式。对于优秀标记和糟糕点击的各种复杂难点,我可以另起一篇文章进行阐释。虽然这仍然为用户提供了强大的体验,但它具有明显的局限性,而自其诞生依赖便一直在困扰着整个行业。从用户体验的角度来看,我不仅需要下载特定的应用程序,同时还需要对应的物理对象才能激活体验。但借助SLAM,用户只需一台移动设备即可访问内容。

2. 即时定位与地图构建(SLAM)

即时定位与地图构建的英文简称是SLAM。这种技术直到最近才成为了一个可行的选择,因为越来越多的设备开始搭载辅助性的深度摄像头(在撰写这篇文章的时候,谷歌苹果已经找到了绕开专用辅助摄像头的方法) ,而这是支持SLAM的必要条件。

这项技术基本上可以主动识别空间中的墙壁,地板和其他物理障碍。目前,大多数利用SLAM的应用程序只是采用楼层识别和位置追踪来把AR对象放置在用户周围的表面上。少数几个平台能够处理额外的空间信息(如墙壁,天花板和家具等等),从而可以更深入地理解周围的环境。目前大量利用这些功能的两大平台是苹果ARKit和谷歌ARCore。

3. 密集式点云重建:3D世界的点描技法

这为开发者创建原来不可能实现的AR体验提供了多样性和灵活性。SLAM能够主动对它认为存在的表面进行每秒数百次的粗略估计,并用描点或顶点固定这些微观位置。通过建立一个密集式点云重建,设备摄像头不仅可以识别物理空间,而且还可以记住物体转向时的相对位置。下面是该技术实时处理信息时的演示:

基于追踪的体验能够提供一个巨大的优势:情景。当用户拾起一个物体时,激活的数字内容感觉就像是物体的一部分。假如我从全麦蜂蜜坚果麦圈中激活了一个AR体验,然后其中的卡通吉祥物从包装盒中飞走,这将成为一种有意义的执行。这种行为使得应用程序能够真正成为物理世界的“浏览器”。用SLAM来实现这一点要困难得多,因为尽管电脑可以更好地理解世界的形式,但无法根据它所看到的内容来提供实质性的反馈。

通过SLAM,用户可以逼真地在办公室里控制卡通水管工人(如马里奥)收集金币或者躲开危险的食肉植物;用实际上并不存在的家具和海报来重新装修卧室;或者在街道上放置一系列箭头,然后用GPS定位到最接近的咖啡店。当这两种不同的交互方式开始无缝融合的时候,我相信我们会看到最强大和最广泛采用的增强现实实现。这种融合技术的潜能无穷无尽。

SLAM技术的应用不仅只局限于增强现实。整体而言,SLAM可以帮助为计算机提供更符合字面意义的“眼睛”,使得它们能够通过视觉输入来理解周围的一切。这种理解已经扩展到机器人,自动驾驶汽车,机器学习和人工智能等领域。

本文链接https://news.nweon.com/40556
转载须知:转载摘编需注明来源映维网并保留本文链接
素材版权:除额外说明,文章所用图片、视频均来自文章关联个人、企业实体等提供
QQ交流群苹果Vision  |  Meta Quest  |  微软HoloLens  |  AR/VR开发者  |  映维粉丝读者

您可能还喜欢...

资讯