智能手机正成为一款AI超算机

小编 ovaliu | 分类：快讯 | 发布日期 2016年9月12日

加入映维网会员

（YiViAn 2016年9月12日）相片存储器、瞬时插画、即时翻译、仿真虚拟现实以及众多新技术即将来临。

9月13日更新后，iPhone用户可以在任何时间寻找附近任何人、任何东西以及任何地点的图片。IOS 1O采用了类神经网络人工智能技术，可在十分之一秒内对拍摄的照片进行110亿次计算，确定照片人物的身份甚至心情。

掌上人工智能技术日新月异，IOS 10照片APP只是最新的案例。Aipoly是今年一月份发布的APP，能够识帮助盲人识别物体并说出名字。你只需将照相机对准某一文本，谷歌翻译就可将其转换成另一种语言。这些功能即使在没有信号的情况下也能使用。

[图片: Flickr 用户 hotrodnz]

正如“在云端”正成为每个“工作原理”的答案一样，智能手机正变得更加独立，能够独立完成任务而无需像以前一样越狱。结果是更加自然的AI体验诞生了，再也不用担心连接数据中心的延时问题了。Aipoly的联合创始人Alberto Rizzoli称，“如果我说，‘嗨Siri，这是什么？’只需两秒它就可以将图片传送到云端并得到回应”。“这感觉好像和一个刚睡醒的人讲话”。Aipoly并不是第一款为盲人设计的APP；但它是第一款可即时识别物体的APP，而且是切断与云端的联系并在手机上独立运行AI。

即时AI技术使AR不仅仅停留在《Pokemon GO》阶段，它能够精确绘制周围环境，并将丰富的3D物体、角色和动画插入手机或平板中的视频。同样地，运用移动AI技术的虚拟现实也会看起来更加真实。Gary Brotman是移动芯片制造商Qualcomn的产品经理，他领导了机器学习平台的开发。他说，“要想正确地完成一件事，所有东西都必须是完全实时的，因此你必须呈现视频、音频以及能够驱动眼球追踪、头部追踪、姿势追踪和立体声效果追踪的智能技术，这样才能将房间的音响效果移植到虚拟体验中”。

[幕后视角展示了Aipoly是如何快速考虑不同选择的可能性。]

AI也会让生活变得更加方便。Rizzoli表示，你可以看到虚拟助理使用手机相机确定你的位置，比如特定的街道或餐馆的内部，并提供相关的APP。仅此一次，这种极度便利不会让人觉得害怕。如果AI不再需要云端支持，那么云端也就不再需要你的个人数据。

Brotman称，“无论是隐私、延迟或者其他种种原因，没有理由不在手机上使用分析和智能工具。”

[stextbox id=black shadow=true bwidth=1]AI[/stextbox]

是什么将AI的功能带到掌上设备？答案是电子游戏。

Rizzoli称，“人们希望手机或iPad上有更好玩的移动游戏，所以Apple、Qualcomn以及其他芯片制造商才这么不遗余力地提供更佳的性能。”这也促进了更多强大的移动CPU和图形处理器的发展。大多数CPU是串行工作的，但GPU是并行工作的，处理更简单但数量庞大的任务以满足快速处理3D图形的需求。AI也需要同时处理大量且简单的工作。

卷积神经网络（CNN）是现代图像识别的主要组成部分。CNN模仿大脑视觉皮层的工作原理，将视域分为重叠磁贴，同时滤掉一些简单的细节，比如这些磁贴的边缘。随后该信息传送到另一层神经元（人体中的生物过程或软件中的虚拟过程），可能将边缘组成称线；另一层可能识别出原始形状。每一层（可能有若干层）都会增加对图像的认识。Rizzoli表示，“你正在看一张照片，你会同时辨认出图片中不同的元素。你看图像的边缘，同时也会分辨其形状。所有这些都是同时进行的。”

[stextbox id=black shadow=true bwidth=1]谷歌翻译[/stextbox]

智能手机芯片已经经受了几年的考验。甚至2013年发售的iPhone 5s仍可支持IOS 10的人物、场景和物体识别功能；Aipoly也正在开发不同版本，使程序可以在iPhone 5及几年前的Android手机上运行。但程序员最新发现这方面可以好好加以利用。六月份上线的图片处理软件Prsima便是最早的采用者之一。

25岁的Aleksey Moiseenkov开发了这款应用，可让手机照片模仿超过30种艺术画作的风格，比如《呐喊》、蒙德里安风格，许多标题十分有趣，例如“美到犯罪”、“火焰喷射器”以及“#GetUrban”。渲染效果几乎是即时的，这让人忽略了其复杂性。Instagram滤镜可以简单地调整基本参数，如色彩、对比度、亮度以及白平衡。而Prsima需要分析图像，识别不同元素，例如形状、线条、色彩以及阴影，并像Edvard Munch或Piet Mondrian一样对其进行重绘。最终呈现的图片十分精美，甚至让原本无趣的图片变得栩栩如生。

[左边是一幅极度无趣的图片，右边是经过Prisma处理的图片。]

起初Prism是在云上工作的，但Moiseenkov称那样会损害APP的品质。他表示，“我们在亚洲拥有众多用户，我们必须让他们拥有相同的体验，无论网络连接状况如何，无论服务器或云处理器在哪。”一款可以在iPhone上完美运行的新应用即将在八月份上线，而Moiseenkov也正在开发相同的Android版本。

Moiseenkov表示，大概在九月份的更新后，视频也可以使用其艺术效果了。“就服务器过载等其他一些方面来说，视频版本的应用要复杂很多，因此在手机上测试这些效果是至关重要的。 ”

[即将上线的新版Prisma可以转换视频及照片。]

Moiseenkove和他的团队投入大量时间研究如何让AI软件在智能手机上运行，但未来的程序员可能不用这么麻烦。五月份，Qualcomn发布了为其骁龙820芯片开发的名为“神经处理引擎”的软件开发者工具包，该芯片支持2016高端Android手机，比如Samsung Galaxy S7及Note 7、Moto Z及Z Force、OnePlus 3、HTC 10以及LG G5。该软件可同时应对CPU、GPU以及芯片其他组件之间的任务，比如场景侦测、文本识别、面部识别及自然语言处理（理解对话语言而非严格的指令）。

专业AI芯片也即将来临。一家名为Movidius的公司开发了视觉处理器（VPU），针对计算机视觉神经网络进行优化。（芯片巨擘英特尔本周承认收购该公司）。该公司最新的Myriad 2芯片可在大疆Phantom 4无人机上运行，帮助其进行观察并躲避障碍物、盘旋以及追踪运动主体，如自行车手或滑雪者。

[stextbox id=black shadow=true bwidth=1]iBrain[/stextbox]

Apple一直对其AI计划含糊其辞，称在六月份预告IOS 10之前不愿意透露太多。

AI驱动的照片应用是最大的组件，其使用神经网络进行深度学习处理，用于识别图片中的场景、物体和面部，并将它们分组，使它们可供检索。其回忆功能可依据人物、场景或任何有意义的事情（如旅行）将照片和视频作成合辑。Apple称，这样做可使个人信息保密。

神经网络还可以支持Apple的输入预测功能，IOS 10之前AI表现很好。Apple于2014年7月将Siri转换成可在手机运行的神经网络，以提高其语音识别能力。

目前大多数APP制造商会将Siri插入到iPhone AI中。Apple并没有像Qualcomn发布骁龙那样发布A系列芯片的AI编程工具，但名为SiriKit的工具可让开发者通过Apple的虚拟助理与苹果应用进行交互。

但Apple并不怕在帮助第三方开发者开发AI方面落后Qualcomn。据报道，公司最近花费2亿美元创建了名为Turi的公司，为程序员提供AI工具。开发者开发起来会更加容易。iPhone 7和7 Plus的A10 Fusion芯片比前几代iPhone运行速度快40％，图形处理速度快50％。

随着人工智能在科技界的发展，它在手机方面的应用也是大势所趋。人们越来越相信这些小东西可以知道我们的需求和想法。“我可以说大多数移动应用将会变成AI应用，”Nardo Manaloto如是说，他是一位AI工程师和顾问，专注于研发健康类应用如虚拟医疗助理。

Alberto Rizzoli希望在一月份的CES上看到众多新应用。他说，“当更多深度学习软件工具出现，并且开发者本身也意识到其发展时，众多App开发者便会蜂拥而至。许多计算机科学专家仍认为这是黑魔法，其实并不是”。

引用参考：Sean Captain@fastcompany

智能手机正成为一款AI超算机

厂商招聘

最新论文

最新专利