SLAM是如何改变增强现实技术的？

编辑：刘余欣 | 分类：快讯 | 2018年1月18日

加入映维网会员

文章相关引用及参考：映维网

当这两种不同的交互方式开始无缝融合的时候，我相信我们会看到最强大和最广泛采用的增强现实实现。

（映维网 2018年01月18日）尽管普及率有限，但增强现实显然是当前最热门的技术领域之一。这在很大程度上是因为通过标记追踪来实现AR传统方式，以及随之而来的高门槛障碍。

SLAM是如何改变增强现实技术的？

1. 图像识别与标记追踪

除了3D模型和动画之外，增强现实的支点是建立在两个紧密相关的技术上：图像识别与标记追踪。当两者配对在一起时，它们可以支持摄像头识别图像的数据，从而触发相关的体验并在三维空间中追踪相对于摄像头的眼睛位置。通过将图像上传至处理服务器，开发者可以将一个或多个图像关联到单个增强现实体验。这样，设备上的摄像头就能够理解并追踪叠加的数字内容。

对于其工作原理，我们首先要理解两个核心概念。首先是Marker Detection（标记检测），即通过相机镜头识别图像（通常称为标记），并且与服务器上的对应部分建立关联以触发体验；其次是Marker Tracking（标记追踪），或者说能够维持物理对象或标记的实时方向，并且不断更新数字内容以模拟它的能力。

一个基于标记的AR体验的例子

检测和追踪的质量由一系列的参数决定，主要是对比点的复杂度和标记所缺乏的重复模式。对于优秀标记和糟糕点击的各种复杂难点，我可以另起一篇文章进行阐释。虽然这仍然为用户提供了强大的体验，但它具有明显的局限性，而自其诞生依赖便一直在困扰着整个行业。从用户体验的角度来看，我不仅需要下载特定的应用程序，同时还需要对应的物理对象才能激活体验。但借助SLAM，用户只需一台移动设备即可访问内容。

2. 即时定位与地图构建（SLAM）

即时定位与地图构建的英文简称是SLAM。这种技术直到最近才成为了一个可行的选择，因为越来越多的设备开始搭载辅助性的深度摄像头（在撰写这篇文章的时候，谷歌和苹果已经找到了绕开专用辅助摄像头的方法），而这是支持SLAM的必要条件。

这项技术基本上可以主动识别空间中的墙壁，地板和其他物理障碍。目前，大多数利用SLAM的应用程序只是采用楼层识别和位置追踪来把AR对象放置在用户周围的表面上。少数几个平台能够处理额外的空间信息（如墙壁，天花板和家具等等），从而可以更深入地理解周围的环境。目前大量利用这些功能的两大平台是苹果ARKit和谷歌ARCore。

3. 密集式点云重建：3D世界的点描技法

这为开发者创建原来不可能实现的AR体验提供了多样性和灵活性。SLAM能够主动对它认为存在的表面进行每秒数百次的粗略估计，并用描点或顶点固定这些微观位置。通过建立一个密集式点云重建，设备摄像头不仅可以识别物理空间，而且还可以记住物体转向时的相对位置。下面是该技术实时处理信息时的演示：

基于追踪的体验能够提供一个巨大的优势：情景。当用户拾起一个物体时，激活的数字内容感觉就像是物体的一部分。假如我从全麦蜂蜜坚果麦圈中激活了一个AR体验，然后其中的卡通吉祥物从包装盒中飞走，这将成为一种有意义的执行。这种行为使得应用程序能够真正成为物理世界的“浏览器”。用SLAM来实现这一点要困难得多，因为尽管电脑可以更好地理解世界的形式，但无法根据它所看到的内容来提供实质性的反馈。

通过SLAM，用户可以逼真地在办公室里控制卡通水管工人（如马里奥）收集金币或者躲开危险的食肉植物；用实际上并不存在的家具和海报来重新装修卧室；或者在街道上放置一系列箭头，然后用GPS定位到最接近的咖啡店。当这两种不同的交互方式开始无缝融合的时候，我相信我们会看到最强大和最广泛采用的增强现实实现。这种融合技术的潜能无穷无尽。

SLAM技术的应用不仅只局限于增强现实。整体而言，SLAM可以帮助为计算机提供更符合字面意义的“眼睛”，使得它们能够通过视觉输入来理解周围的一切。这种理解已经扩展到机器人，自动驾驶汽车，机器学习和人工智能等领域。