停产专题:Kinect的起源、发展与核心技术进化
文章相关引用及参考:fastcodesign
微软确认Kinect已经停产。
(映维网 2017年10月26日)微软确认Kinect已经停产。这款具备深度摄像头和语音识别麦克风的硬件最初专为微软游戏主机Xbox 360设计。自2010年首次亮相以来,Kinect已售出约3500万台。现在映维网了解到,当零售商售完了现有的库存后,微软将不再生产Kinect。这家公司将继续为Xbox的客户提供Kinect售后支持,但开发工具是否将继续下去仍不得而知。Kinect之父亚历克斯·基普曼和Xbox设备营销总经理马修·乐普森(Matthew Lapsen)在接受Co.Design的专访时公布了这一消息。
由于Xbox团队正重新围绕传统游戏来对抗PS4,Kinect已经慢慢淡出微软的蓝图。然而,尽管作为独立产品的Kinect已经退出市场,但其核心传感器技术将继续保留。Kinect v4,以及即将登场的Kinect v5将作为微软HoloLens的驱动力量,而后者同样是基普曼的心血结晶。与此同时,Kinect的专家团队已经开始研发重要的微软技术,包括Cortana小娜语音助手,Windows Hello生物识别面部识别系统,以及名为Gaze, Gesture and Voice (GGV)的情景感知用户界面。
Kinect最初于2010年上市,而微软更是拿出了5亿美元的营销预算。通过无形的红外线点,这款设备将房间映射至3D空间之中,并且能够实现前所未有的身体追踪。Kinect似乎非常有潜力令玩家不再窝在沙发上。当你可以亲身躲闪时,为什么还要按下手柄的按钮呢?Kincet同时支持方便的语音命令,比如只需说出“打开Xbox”,Xbox One主机就能马上打开。
作为第一批尝鲜Kinect的用户,我(MARK WILSON)当时认为这款设备不仅只是微软祭出的“任天堂Wii 杀手”(你还记得任天堂Wii吗?!?)。微软试图弥合人体和人体界面之间的界限,突破键盘,鼠标,甚至是触摸屏的现有限制。
我当时写道:“使用微软Kinect系统有种非常特别的感觉,一种区分开Kinect与我以前使用过的其他软件和硬件组合。Kinect适合和适应用户。不是说我在学习它,而是说它正在学习我…我从来都不觉得一台电脑能够如此地理解我,理解这么一个有血有肉的人类。”
可以毫不夸张地说,Kinect在过去几年中一直是除iPhone以外唯一最有影响力的,至少是前所未有的硬件。微软表示,Kinect在技术上是第一个以机器学习为核心的消费级设备。Kinect在功能上也得到了厂商的纷纷模仿。自2010年以来,苹果推出了Siri语音助手,这复制了Kinect的控制功能;谷歌开始了自己的3D追踪系统项目,亦即我们后来熟悉的Project Tango。现在几乎所有智能手机都存在视觉和语音系统,而且它们正在逐渐走进我们的居所。亚马逊Echo为我们祖父母客厅带来了语音助理,而更新的“Echo Show”更是为Alexa添加一个摄像头。即使是联网的Nest Cam都需要感谢Kinect作为首款诞生的类似设备,以及其承担了人们对Kinect开启了全新隐私担忧时代的指责。
基普曼表示:“信任需要一点一点地累积,但可以在一瞬间消失全无。”他暗指了Kinect在消费者隐私方面引起全行业的关注。基普曼继续说道:“我会说,Kinect在2010年开始了慢慢赢得信任的过程。世界上发生的任何(糟糕的)事件,任何一个,你都会失去大量的信任。”但令Xbox失去消费者的原因不会是信任或隐私问题,而是一个认为创新需要牺牲乐趣的薄情粉丝团。
1. 创造者和消费者
“哦,我的上帝。耶稣。这就是我的反应。你可以引用我的原话,‘哦,逗号,该死,句号’。”
这是卡内基梅隆大学Studio for Creative Inquiry负责人戈兰·莱文(Golan Levin)在听到Kinect停产消息时的发硬。从实验性艺术到创建下一代的UI原型,他的实验室(以及其他类似实验室)都在使用Kinect。
“你知道,我们的存活都全靠资本。没有人会期待微软做出不符合自己底线的事情。”莱文继续说道,他非常小心地选择自己的措辞,“但这是其中一个令我感到十分伤心的时刻,一个支持了如此多应用程序的工具,一个如此无处不在的工具,一个已经成为如此多不同领域中的众创意实验,文化进步和次要创新的平台,居然不能支持他们的核心业务。”
他总结说:“有人认为,使用Kinect的游戏并没有卖出足够多的数量,而这是一种耻辱。”至少在某种程度上,这的确是事实。
如果Kinect在取得市场成功的道路上出了一个问题,那你可以将其称之为“玩家”。尽管设备确实存在一定功能缺陷(包括延迟和偶尔的语音识别错误),但这款Xbox 360附件迅速吸引了市场的关注。然而,优秀的游戏从来没有真正出现在360度空间。没有大制作的游戏系列愿意为Kinect开发内容,比方说《使命召唤》或《侠盗猎车手》。反过来,微软似乎制定了一个明智的计划。为了确保开发商对Kinect游戏的投入能够值回票价,微软把Kinect与Xbox One主机进行了捆绑销售。这无疑能确保更大的市场。然而,微软在Xbox One的设计上时刻为Kinect保留了一小部分RAM和处理能力,这意味着游戏开发者无法为自己的图形和物理来挖掘这些资源。
当微软发布Xbox One时,他们承诺给玩家带来一台客厅电脑,其可以控制你的游戏,有线电视盒,甚至在未来某一天能够控制整个房屋。在创新性的UI中,索尼策划了一次完美的反击。在Xbox One发布三周后的E3大会上,时任PlayStation美国执行总监杰克·特雷顿在讲台上说道,索尼“专注于玩家最为渴望的东西…例如,PS4不会强加限制任何…”这时特雷顿不得不停下来,因为下面的人群正在大声欢呼,他们已经知道开发者将能获取PS4的完整系统资源。接下来,特雷顿抓住了人们对Xbox One的另一个忧虑。他指出索尼是一家以玩家为先的企业,并宣布PS4将以更低的价格与玩家见面。诸如Reddit这样的论坛掀起了巨大的反响,尤其是自称为“硬核玩家”的群体。多年后,市场分析机构的报告显示PS4和Xbox One的销售比例已经达到2:1。为扭转局势,微软试图降低Xbox One的价格,并且从芯片组中获得更多的游戏性能,所以他们通过分拆出Kinect来释放其专用的系统资源。Kinect不再是Xbox的捆绑附件,这减少了Kinect游戏开发商原有的保证市场。
乐普森说:“当我们发布Xbox One的时候,我们将其设计成能通过Kinect提供最好的体验。这是Xbox One发售时的目标。像所有的产品一样,你会随着时间的推移保持观察,你会不断学习和及时调整。在实践中,Xbox的目标演示更多地关注一些额外的多边形,而不是人机交互中的一些新范例。所以微软决定把精力专注于其他产品。”
但莱文和其他类似的研究人员都十分钟爱Kinect这种前瞻性的技术。“Kinect的重要作用是,它说明了你可以使用廉价的深度摄像头。它同时支持开发使用深度感知的数千种应用程序。”莱文指出,正是微软Kinect硬件才使得诸如Faceshift这样的初创公司成为可能。为了对适合安全生物识别的人脸实现极致的3D追踪,苹果收购了Faceshift以替代指纹扫描。为了利用这项技术,苹果基本上在iPhone X中克隆了一个Kinect。
莱文继续说道:“这是由于Kinect才成为可能的成千上万的应用之一。更不用提Kinect对计算机研究,机器人研究和交互式媒介艺术所带来的巨大影响。”莱文的一些学生使用Kinect在点阵3D中制作了一部纪录片,然后在真正的纽约地铁车型内创造了一部交互式影片。莱文指出,除了可被攻破的独立Kinect外,今天市面上还有其他深度感应摄像头。但他还补充说,对于所有展示基于Kinect的交互式艺术的博物馆而言,他们可能希望前往eBay购买更多的Kinect作为备份。
2. Kinect进化
Kinect或许为游戏玩家和研究人员带来了巨大影响,但这款硬件并非完全消失。与任何单一的产品相比,大公司项目的命运往往更加微妙。除了Cortana小娜等关键微软技术,Kinect仍然是微软将继续投资的重要传感器平台。
在Skype中,亚历克斯·基普曼在白板上绘制了他在过去十年中的发展历程,从2007年的Kinect到现在的HoloLens产品。
基普曼回忆说:“我们看着我们面前的问题。我们正越来越多地使用科技。我们说,‘看,如果我们在这些(科技)上花费的时间越来越多,两件事情中将会发生一件’。要么我们要花更多的时间以机器方式与机器进行交互,并且处理屏幕背后的内容;要么我们将会教导机器更好地交互我们的世界和模拟宇宙,并教它们彼此共存。”
他总结说:“作为人类,我为我们选择了第二条道路。”
计算机在未来有可能理解人类存在的全部。为了理解这一点,基普曼的论点可以分解成一个3×3的框框。在X轴上,你看到有输入,输出和触觉;Y轴上是人,环境和对象。每个方格都代表着一个数量级,而且一个比一个更难。追踪一个人?这很难,但追踪有着微妙差异的环境要比追踪人类难上10倍。对于追踪有着不同纹理和情境差异的对象,这更要比追踪人类难上一百倍。
作为“懒人”工程师基普曼选择专注于最简单的方格,亦即人类输入。这意味着计算机需要理解手势和语音。
他说:“人们说我发明了Kinect。Kinect并不是我发明的,我只是过了一遍这个表格,然后发现了(最简单的机遇)。”
随着时间的推移,Kinect已经有了更大的提升。从原来的50度视场,到80度,再到HoloLens中使用的120度V4传感器,Kinect的视场正不断扩大。而且至关重要的是,Kinect的功率正变得越来越小:从50W减少至25W。
这些稳定的提升使Kinect能够实现小型化,足以支持人类穿戴。在表格中的哪一个方格? 基普曼说:“我们到了后边,然后往下一格走。我们说,‘我们大概已经知道如何实现简单的1X1难度级问题,现在是是否朝更大的目标前进了’。”所以在2015年,微软发布了HoloLens。一个10×10的难度级问题:环境输出。这意味着Hololens不仅可以“看到”人类,更能“看到”空间。它不仅能识别这个空间,更能让人类们向这个空间输出:拖放全息图。
基普曼继续说道:“这基本上就是HoloLens所做的事情。理解人类输入的所有一切,同时从输出角度上理解人类。现在,我可以把光子放在你的眼睛后面,让你看到全息图。我也可以令一些东西浮动起来。这与随后将其固定到现实世界中有本质上的区别。这意味着我们也理解环境。”
下一步?HoloLens研发部门将继续令Kinect传感器变得更好。据了解,Kinect的V5版本在最为活跃情况下的功率小于1.5W,这比原来Kinect的功耗低约50倍。而且随着AI的不断加持帮助,微软可以继续追求表格上100×100的难度级问题:对象触觉。在最后,我们将能实现《星际迷航》中的全息甲板。我们不再操纵光子,我们可以操纵物质。就像谷歌和麻省理工学院媒体实验室一样,数据和对象成为一体。
基普曼说:“我们的愿景是,我们一直在等待的事情是,我个人将在余下时间里不断努力实现的是,确保我们能够更多地填满这个表格。让人们能够以更加人性化的方式使用科技。”