Meta亮相AI系统Builder Bot:通过语音命令生成VR虚拟世界
创造实现下一个计算时代的基础技术
(映维网Nweon 2022年02月24日)在日前举行的“Inside the Lab”揭秘实验室活动中,Meta分享了团队在人工智能研发方面的最新突破。这家公司表示:“这是Meta志在创造实现下一个计算时代的基础技术的长期努力之一。这对我们构建元宇宙的未来非常重要。”
具体来说,Meta正在测试一个只需利用语音命令就可以生成或将内容导入虚拟世界的人工智能系统:Builder Bot。
在一段预先录制的1分半视频中,Meta首席执行官马克·扎克伯格和一位同伴及Builder Bot人工智能助手首先置身于一个空白空间。随后,扎克伯格向Builder Bot发出了一系列的语音命令,以语言描述创建了一个虚拟场景。例如,“let’s go to a park”可以将场景变成公园,而“let’s go to the beach”则会变成沙滩。然后扎克伯格继续通过“add some cloud”等描述来为场景添加了云朵,岛屿,椰子树,木桌,啤酒和收音机等等。
需要注意的是,扎克伯格没有说明Builder Bot是否有利用一个人力创建的模型库,抑或是单纯依靠人工智能。
实际上,行业早已有多个基于文本或基于语音描述生成内容的人工智能项目和应用,包括OpenAI的DALL-E,英伟达的GauGAN2和VQGAN+CLIP等项目,以及《Dream by Wombo》和《Moatboat》等应用程序。
对于Builder Bot,扎克伯格希望简化内容生成的难度,从而进一步普及元宇宙。他表示:“你将能够利用自己的声音创造一个可以探索和分享的精妙世界。”
延伸阅读:Promethean AI允许通过语音命令创建VR游戏美术场景
同类工具Promethean AI的演示(这个不是Meta的)
当然,视频未演示生成的对象是否具有交互性,而扎克伯格承认,对于VR用户认为理所当然的复杂交互性是一项重大挑战。目前不确定当前系统的局限性,所以短期内或许不会看到Meta的VR社交平台出现Builder Bot,但我们显然可以期待Meta的未来愿景。
值得一提的是,扎克伯格在活动期间同时宣布了一项构建通用语言翻译器的计划。他表示:“用任何语言来与任何人交流的能力是一种梦寐以求的超能力,而人工智能将能在我们的有生之年实现这一点。”
Meta指出,消除语言障碍将是一项意义深远的工作:它将能帮助数十亿人以自己的母语或首选语言获取网络海洋的信息。机器翻译的进步不仅会帮助不懂当今主导互联网的语言的人士,它们将从根本上改变人们联系和分享想法的方式。
需要注意的是,Meta强调这是一个长期努力。但如果能够成功,相信团队将能进一步提升Meta的元宇宙社交体验。