智能手机正成为一款AI超算机
(YiViAn 2016年9月12日)相片存储器、瞬时插画、即时翻译、仿真虚拟现实以及众多新技术即将来临。
9月13日更新后,iPhone用户可以在任何时间寻找附近任何人、任何东西以及任何地点的图片。IOS 1O采用了类神经网络人工智能技术,可在十分之一秒内对拍摄的照片进行110亿次计算,确定照片人物的身份甚至心情。
掌上人工智能技术日新月异,IOS 10照片APP只是最新的案例。Aipoly是今年一月份发布的APP,能够识帮助盲人识别物体并说出名字。你只需将照相机对准某一文本,谷歌翻译就可将其转换成另一种语言。这些功能即使在没有信号的情况下也能使用。
[图片: Flickr 用户 hotrodnz]
正如“在云端”正成为每个“工作原理”的答案一样,智能手机正变得更加独立,能够独立完成任务而无需像以前一样越狱。结果是更加自然的AI体验诞生了,再也不用担心连接数据中心的延时问题了。Aipoly的联合创始人Alberto Rizzoli称,“如果我说,‘嗨Siri,这是什么?’只需两秒它就可以将图片传送到云端并得到回应”。“这感觉好像和一个刚睡醒的人讲话”。Aipoly并不是第一款为盲人设计的APP;但它是第一款可即时识别物体的APP,而且是切断与云端的联系并在手机上独立运行AI。
即时AI技术使AR不仅仅停留在《Pokemon GO》阶段,它能够精确绘制周围环境,并将丰富的3D物体、角色和动画插入手机或平板中的视频。同样地,运用移动AI技术的虚拟现实也会看起来更加真实。Gary Brotman是移动芯片制造商Qualcomn的产品经理,他领导了机器学习平台的开发。他说,“要想正确地完成一件事,所有东西都必须是完全实时的,因此你必须呈现视频、音频以及能够驱动眼球追踪、头部追踪、姿势追踪和立体声效果追踪的智能技术,这样才能将房间的音响效果移植到虚拟体验中”。
[幕后视角展示了Aipoly是如何快速考虑不同选择的可能性。]
AI也会让生活变得更加方便。Rizzoli表示,你可以看到虚拟助理使用手机相机确定你的位置,比如特定的街道或餐馆的内部,并提供相关的APP。仅此一次,这种极度便利不会让人觉得害怕。如果AI不再需要云端支持,那么云端也就不再需要你的个人数据。
Brotman称,“无论是隐私、延迟或者其他种种原因,没有理由不在手机上使用分析和智能工具。”
[stextbox id=black shadow=true bwidth=1]AI[/stextbox]
是什么将AI的功能带到掌上设备?答案是电子游戏。
Rizzoli称,“人们希望手机或iPad上有更好玩的移动游戏,所以Apple、Qualcomn以及其他芯片制造商才这么不遗余力地提供更佳的性能。”这也促进了更多强大的移动CPU和图形处理器的发展。大多数CPU是串行工作的,但GPU是并行工作的,处理更简单但数量庞大的任务以满足快速处理3D图形的需求。AI也需要同时处理大量且简单的工作。
卷积神经网络(CNN)是现代图像识别的主要组成部分。CNN模仿大脑视觉皮层的工作原理,将视域分为重叠磁贴,同时滤掉一些简单的细节,比如这些磁贴的边缘。随后该信息传送到另一层神经元(人体中的生物过程或软件中的虚拟过程),可能将边缘组成称线;另一层可能识别出原始形状。每一层(可能有若干层)都会增加对图像的认识。Rizzoli表示,“你正在看一张照片,你会同时辨认出图片中不同的元素。你看图像的边缘,同时也会分辨其形状。所有这些都是同时进行的。”
[stextbox id=black shadow=true bwidth=1]谷歌翻译[/stextbox]
智能手机芯片已经经受了几年的考验。甚至2013年发售的iPhone 5s仍可支持IOS 10的人物、场景和物体识别功能;Aipoly也正在开发不同版本,使程序可以在iPhone 5及几年前的Android手机上运行。但程序员最新发现这方面可以好好加以利用。六月份上线的图片处理软件Prsima便是最早的采用者之一。
25岁的Aleksey Moiseenkov开发了这款应用,可让手机照片模仿超过30种艺术画作的风格,比如《呐喊》、蒙德里安风格,许多标题十分有趣,例如“美到犯罪”、“火焰喷射器”以及“#GetUrban”。渲染效果几乎是即时的,这让人忽略了其复杂性。Instagram滤镜可以简单地调整基本参数,如色彩、对比度、亮度以及白平衡。而Prsima需要分析图像,识别不同元素,例如形状、线条、色彩以及阴影,并像Edvard Munch或Piet Mondrian一样对其进行重绘。最终呈现的图片十分精美,甚至让原本无趣的图片变得栩栩如生。
[左边是一幅极度无趣的图片,右边是经过Prisma处理的图片。]
起初Prism是在云上工作的,但Moiseenkov称那样会损害APP的品质。他表示,“我们在亚洲拥有众多用户,我们必须让他们拥有相同的体验,无论网络连接状况如何,无论服务器或云处理器在哪。”一款可以在iPhone上完美运行的新应用即将在八月份上线,而Moiseenkov也正在开发相同的Android版本。
Moiseenkov表示,大概在九月份的更新后,视频也可以使用其艺术效果了。“就服务器过载等其他一些方面来说,视频版本的应用要复杂很多,因此在手机上测试这些效果是至关重要的。 ”
[即将上线的新版Prisma可以转换视频及照片。]
Moiseenkove和他的团队投入大量时间研究如何让AI软件在智能手机上运行,但未来的程序员可能不用这么麻烦。五月份,Qualcomn发布了为其骁龙820芯片开发的名为“神经处理引擎”的软件开发者工具包,该芯片支持2016高端Android手机,比如Samsung Galaxy S7及Note 7、Moto Z及Z Force、OnePlus 3、HTC 10以及LG G5。该软件可同时应对CPU、GPU以及芯片其他组件之间的任务,比如场景侦测、文本识别、面部识别及自然语言处理(理解对话语言而非严格的指令)。
专业AI芯片也即将来临。一家名为Movidius的公司开发了视觉处理器(VPU),针对计算机视觉神经网络进行优化。(芯片巨擘英特尔本周承认收购该公司)。该公司最新的Myriad 2芯片可在大疆Phantom 4无人机上运行,帮助其进行观察并躲避障碍物、盘旋以及追踪运动主体,如自行车手或滑雪者。
[stextbox id=black shadow=true bwidth=1]iBrain[/stextbox]
Apple一直对其AI计划含糊其辞,称在六月份预告IOS 10之前不愿意透露太多。
AI驱动的照片应用是最大的组件,其使用神经网络进行深度学习处理,用于识别图片中的场景、物体和面部,并将它们分组,使它们可供检索。其回忆功能可依据人物、场景或任何有意义的事情(如旅行)将照片和视频作成合辑。Apple称,这样做可使个人信息保密。
神经网络还可以支持Apple的输入预测功能,IOS 10之前AI表现很好。Apple于2014年7月将Siri转换成可在手机运行的神经网络,以提高其语音识别能力。
目前大多数APP制造商会将Siri插入到iPhone AI中。Apple并没有像Qualcomn发布骁龙那样发布A系列芯片的AI编程工具,但名为SiriKit的工具可让开发者通过Apple的虚拟助理与苹果应用进行交互。
但Apple并不怕在帮助第三方开发者开发AI方面落后Qualcomn。据报道,公司最近花费2亿美元创建了名为Turi的公司,为程序员提供AI工具。开发者开发起来会更加容易。iPhone 7和7 Plus的A10 Fusion芯片比前几代iPhone运行速度快40%,图形处理速度快50%。
随着人工智能在科技界的发展,它在手机方面的应用也是大势所趋。人们越来越相信这些小东西可以知道我们的需求和想法。“我可以说大多数移动应用将会变成AI应用,”Nardo Manaloto如是说,他是一位AI工程师和顾问,专注于研发健康类应用如虚拟医疗助理。
Alberto Rizzoli希望在一月份的CES上看到众多新应用。他说,“当更多深度学习软件工具出现,并且开发者本身也意识到其发展时,众多App开发者便会蜂拥而至。许多计算机科学专家仍认为这是黑魔法,其实并不是”。
引用参考:Sean Captain@fastcompany