Facebook人工智能研究室推出神经网 打造虚拟世界将成易事
(YiViAn 2016年4月10日)今年的GPU技术大会上,Facebook人工智能研究中心(Facebook AI Research)展示了一个神经网(neural net),它可以根据文字描述生成独特的图片。工作人员首先输入了“沙滩”一词,接着就出现了一幅带有云朵的沙滩图;然后他们输入了“沙滩-云朵”,生成了一幅万里无云蓝天碧海沙滩图;最后,输入了“日落沙滩-云朵”,于是便出现了一幅笼罩在橘红色日落中的沙滩图。
尽管此次大会异彩纷呈,不乏真实感满分的图片,自动驾驶汽车和超极计算机等亮点,但Facebook的这个展示仍然引来最多的赞叹,这也是名至实归。神经网成了人工智能发展领域的宠儿,简单来说,它是一种尝试模仿人类大脑运作方式的算法。
Facebook所做的就是用几千张(甚至几万万张)不同的图片训练神经网把特定的词语与特定的图片类型联系起来,在经过足够的训练后(需要一部数据容量足够大的超极计算机),获取结果的时间就相对较短。
这个技术的关键在于让系统能够通过文字把不同的图像结合起来,它不仅能够识别一张图片的单个元素,同时还能够灵活地移除和替换这些元素,而这些都能够通过一种自然语言界面实现,即描述一个图像然后立刻成像。
神经网首先接受的是2D图片如绘画的训练,不过,这个技术如果能应用于3D领域将大有作为。打造虚拟现实空间需要大量的3D艺术,如果能够使用神经网根据文字描述制作3D物体,将大大加快VR内容创建的进程,这一目标也许并不是那么遥遥无期。
DeepMind(归Google所有)在短短一年的时间内就从一个2D游戏神经网发展成3D游戏神经网。
无论如何,要打造能够生成3D物体的神经网还有许多障碍需要克服。第一,需要调整算法,使神经网从识别2D内容发展成能够识别3D内容。不过,计算机视觉技术的进步以及3D计算的走红都将推动这一技术研究向前发展。其次,网上应该没有足够的3D内容用来训练3D神经网。要解决这个问题,开发者或许需要找到一个结合2D和3D图像识别的方法。同时,虚拟现实和增强现实技术的普及将会为我们带来更多的3D内容。
以目前人工智能和3D产业的发展速度,我认为十年之内能够生成3D内容的神经网就会问世。一旦有了这项技术,打造一个虚拟世界就会像写场景描述一样简单。
引用声明:本文消息源来自uploadvr,图片来自uploadvr。