SLAM技术在如何重塑AR市场格局
文章相关引用及参考:venturebeat
市场分析机构预计AR将成为一个十亿美元的市场,AR很可能是下一个划时代的产品,相信没有一位科技巨头希望落在后面
(映维网 2017年8月1日)在6月初,苹果通过ARKit首次进军AR/VR市场。令ARKit脱颖而出的是一种名为SLAM(即时定位与地图构建)的技术。每位技术巨头(尤其是苹果,谷歌和Facebook)都在大力投资SLAM技术,而可以发挥出SLAM技术全能潜能的企业将有可能攀上顶峰。
SLAM是一种用于计算机视觉的技术,通过采集物理世界的视觉数据来获得相应场景的三维信息。SLAM可以赋予机器视觉输入,使其获得“视力”并了解周围环境。例如,机器通过SLAM技术看到的场景就如同上图所示。
借助上图所示的数据点,机器可以了解它们的周围环境。这种数据也有助于AR开发者创建更具交互性和更为逼真的体验。这种理解可以用于机器人,自动驾驶汽车,AI和增强现实等不同的场景中。
这种技术可实现的最简单理解是识别墙壁,障碍物和地板。现在,大多数的AR SLAM技术(如ARKit)只通过地板识别和位置追踪来把AR对象置放在你周围,所以它们实际上并不知道你的环境正在发生什么事情,因此不能做出正确的反应。更先进的SLAM技术(如谷歌Tango)则可以创建一个关于我们环境的网格,这样机器不仅可以识别地板的所在位置,而且还可以识别你环境中的墙壁和对象,使你周围一切都成为一种可以与之交互的元素。
一. 基于标记的AR
数年前,苹果收购了行业领先的德国AR公司Metaio。Metaio是一家极具创新性的企业,并在AR市场上占有重要地位。我们看到的ARKit实际上是Metaio SLAM技术的改进版本。没错,早在苹果ARKit之前就已经有企业在安卓和iOS中推出了SLAM,如Wikitude和Kudan。但显然,苹果推出的技术比现有的SLAM技术要好得多。
在此之前,大多数AR体验都是基于标记,这意味着你需要把设备摄像头指向一个定义图像,这样才能够查看AR体验。定义图像可以让你的设备了解和追踪重叠的数字内容。这种技术的问题在于用户必须使用物理对象(图像)。因此,企业需要同时推广应用和物理对象(如卡片和宣传册等)。
奥迪的增强现实目录
但现在ARKit已经解决了一切问题,你需要的知识移动设备。但不要忘记一个重要的要素:情景。
二. 只识别地板并不足够
基于标记的技术存在局限,但其具备上下文情景,这意味它对物理世界(通过定义图像)有所了解,并且可以基于这一点来改变体验。例如,你可以打开一个应用,把设备摄像头指向麦当劳的食品盒,然后体验麦当劳的增强现实体验,或者接下来再把设备摄像头指向星巴克的杯子,并体验完全不同的增强现实内容。这种中央应用程序称为AR浏览器,而AR浏览器将在AR的未来发挥关键作用。
所以虽然ARKit是一个优秀的技术,但它缺乏上下文情景,它的应用程序不能了解用户使用它们的位置。开发者可以使用GPS数据或环境光源等输入来添加更多的上下文,但其核心并不具备上下文情景。上周,有开发者利用ARKit创建了一个有趣的导航演示作品,但需要注意的是,这种演示把GPS数据作为输入,他们无法通过视觉输入进行位置是别,因此不能比拟谷歌Tango的室内导航技术。
毫无疑问,未来的AR在于SLAM技术,但要发挥出真正的潜能(不是Snapchat滤镜那样只是为了好玩),其需要上下文。显然,谷歌这样的科技巨头已经充分意识到这一点。
三. 谷歌并不着急
谷歌正通过Project Tango实施SLAM技术,并与联想等企业携手研发。Tango主要通过两个摄像头来感知深度,并通过SLAM映射来了解世界。与苹果ARKit不同,Project Tango拥有上下文情景,所以它可以实施“室内导航”这样的应用。SLAM映射是机器对世界进行视觉理解的数据库,它们的重要性在于其能够让机器与物理世界相互作用,并能区分不同的场所。
最近的分析表明,谷歌实际上在AR竞争中领先一步。上下文是最重要的元素,不过谷歌的Project Tango在短期内难以实现腾飞,因为它需要特殊的硬件(两个摄像头来感知深度,而目前只有寥寥无几的设备可以支持)。
谷歌已经拥有了上下文,并通过Google Lens获得了对世界的视觉理解。这种数据将更加有价值,因为人们将会从移动设备转向AR眼镜这样的可穿戴设备。
四. 正在追赶的Facebook
谷歌在增强现实领域的主要竞争对手不是苹果,而是Facebook。Facebook的优势在于其拥有20亿名用户,一旦开发出一种能够让社区处理映射的方法,这将会给Facebook带来巨大的杠杆作用。与苹果不同,Facebook的AR愿景全部在于自己的应用程序,他们不允许用户在自己的应用程序中使用相关技术。
最近的分析认识指出,苹果允许用户在自己的应用程序中实施AR技术,这使苹果更具优势。然而,随着针对物理世界中的视觉映射的争夺升温,把一切信息都包裹起来的Facebook可能更胜一筹。
Snap也是一家拥有大量用户并意识到这一机遇的科技公司。在最近公布的专利文件中,Snap介绍了一种结合GPS数据和SLAM映射来把相关AR内容投射在现实世界中的技术。与此同时,联想也正在与Wikitude合作研发名为Augmented Human Cloud的SLAM数据库。
五. 一个数据库足以
拥有最完整SLAM数据库的公司有可能成为最终获胜者。这个数据库将允许这群巨头以隐喻的方式关注世界。例如,Facebook可以通过分析图像来标记和定位你图片的拍摄位置,或者谷歌可以通过分析智能眼镜的摄像头馈送来把广告和虚拟广告牌置放在你的周围。另外,自动驾驶汽车可以单纯通过视觉数据进行导航前进。
每个科技巨头都知道拥有这个数据库的重要性,而他们都有各自的优势和劣势。
- 苹果拥有最为统一的智能手机平台,可以方便地向用户提供在智能手机上体验AR的力量,就如同ARKit。但它缺乏社区的力量。
- Facebook拥有社区的力量,但缺乏完全掌控的平台。
- 谷歌拥有安卓平台,同时还具备Google Lens和Tango等产品,但缺乏社区的力量,而且Project Tango可能因为需要特殊硬件而不太可能实现腾飞,同时很少有公司支持他们的愿景和方法。
对物理世界的视觉理解将成为科技巨头在未来几年内进行战斗的场所。市场分析机构预计AR将成为一个十亿美元的市场,AR很可能是下一个划时代的产品,相信没有一位科技巨头希望落在后面。