谷歌Project Genie打造实时可探索虚拟世界,预示VR未来图景
预示VR未来图景
(映维网Nweon 2026年01月31日)谷歌旗下AI研究实验室DeepMind于去年8月发布了第三代Genie系统,展示了能够实时生成交互式虚拟环境的AI技术。如今,谷歌推出了实验性原型,订阅谷歌AI高级服务的用户现已可抢先体验。尽管尚不能即时生成VR世界,但我们已经离这个目标近得令人心动。

谷歌将Project Genie称为“实验性研究原型”,所以它目前尚不是人们梦想中的那种“AI游戏机”。本质上,它允许用户通过网页界面创建、探索和修改交互式虚拟环境。
系统与先前的图像和视频生成器颇为相似,都需要输入文本提示词或上传参考图像,但Project Genie更进一步。
它设有两个主要的提示输入框,一个用于生成环境,另一个用于生成角色。第三个提示框则允许用户在完整生成环境前调整初始外观(例如:将剑变大、将树木变为秋季形态)。
谷歌指出,作为早期研究系统,Project Genie存在诸多局限:生成的环境可能不符合真实世界的物理规律或提示要求;角色控制可能不稳定;每次体验限时60秒;且先前宣布的特定功能尚未包含在内。
目前,用户只能输出体验过程的视频,不过可以探索并重新混编作品库中已有的其他“世界”。
Project Genie目前正面向美国境内年满18岁的谷歌AI Ultra订阅用户逐步开放,未来计划推广至更广泛的人群。更多信息请访问这个页面。
在VR头显实现类似Project Genie的功能,仍有重重障碍需要克服。
最重要的挑战之一无疑是云串流。坦率地说,云游戏虽已登陆VR设备,但现阶段体验并不理想,因为延迟会因用户与数据中心距离的远近而有很大波动。另外,当前云游戏领域的主要平台(如NVIDIA GeForce Now、Xbox云游戏)大多针对平面屏幕游戏设计;在渲染和输入延迟方面,VR头显的标准要严苛得多,通常要求动显延迟不超过20毫秒,以避免用户产生不适感。
这还没考虑Project Genie需要以立体视觉方式渲染世界可能带来的新问题:系统技术上需要生成两个不同的视点,并融合成一个稳固的3D画面。
据悉,Project Genie创建的世界模型具有概率性特征,即物体的行为每次都可能略有不同,这同时是第三代系统每次只能支持最多几分钟持续交互的原因之一。系统的世界生成容易偏离初始提示,可能导致不如人意的结果。
所以,尽管短期内不太可能见到其VR版本,但我对通往最终目标的这些蹒跚起步感到兴奋。从学习的角度看,能够像《星际迷航》中的全息甲板那样,随意召唤一个可探索的世界,这个想法本身就极具吸引力。谷歌地球VR对很多人来说已经是一个常用应用,而我甚至能想象出一个更细致、更生动的版本,来帮助我学习外语、进行时间旅行和虚拟环球游览。
我总有一种感觉:未来正在塑造成一个非常奇特,但希望同时是一个非常有趣且不至于太糟糕的世界。我可以想象一个未来:逼真的、由AI驱动的环境与脑机接口技术紧密结合(Valve公司已研究这两项课题多年),最终呈现出我真正期待的那种虚拟现实。

