Meta VR视觉图灵征途:深度分享变焦、畸变、高分辨率、HDR等原型设计和研发
挑战视觉图灵测试的征途故事,详细介绍了针对变焦、畸变、视网膜分辨率和HDR等方面的原型灵感和研发过程
(映维网Nweon 2022年06月22日)Meta首席执行官马克·扎克伯格和Reality Labs首席科学家迈克尔·亚伯拉什(Michael Abrash)日前通过视频亮相了一系列的VR原型,从而展示了团队在探索探索变焦、畸变、视网膜分辨率、HDR等挑战的成果努力。
其中,扎克伯格提到了所谓的“视觉图灵测试”。简单来说,为了令人类视觉系统完全相信头显呈现的一切都是真实,从而为VR头显带来与物理现实别无二致的视觉体验,VR头显必须满足一系列的条件,包括变焦、畸变、视网膜分辨率、HDR等方面。
现在,团队专门撰文介绍了他们挑战视觉图灵测试的征途故事,详细介绍了针对变焦、畸变、视网膜分辨率和HDR等方面的原型灵感和研发过程。下面是映维网的具体整理:
2020年11月,Meta创始人兼首席执行官兼马克·扎克伯格向首席技术官安德鲁·博斯沃思(Andrew Bosworth)和Reality Labs首席科学家迈克尔·亚伯拉什发送了一封电子邮件,并提出了一个非常直截了当的问题:“是什么阻止我们拥有一个几乎与物理现实别无二致的虚拟现实。为了实现这一点,我们必须解决什么问题?”
从2015年前往一家前景满满的增强现实公司,到频繁的电子邮件、一对一讨论和技术评论,再到多年来在雷德蒙德和门罗公园的多次演示,这是扎克伯格和亚伯拉什就构建先进虚拟现实显示系统进行的又一次详细对话。
你或许认为两人对问题的回答只是纸上谈兵,但事实并非如此。在过去五年中,由道格拉斯·兰曼(Douglas Lanman)领导的显示系统研究团队(Display Systems Research/DSR)一直在对问题所需的所有技术进行深入研究。实际上,在明确和规划DSR团队未来十年的VR显示器愿景方面,这是在正确的时间里所提出的正确问题:通过视觉图灵测试。
1. 显示系统研究的圣杯
图灵测试由艾伦·图灵于1950年设计,目标是评估计算机是否具有人类智能的测试。视觉图灵测试由DSR团队采用,并旨在与领先的学术团队一起帮助普及,而它的目标与前面陈述类似:评估VR头显显示的内容是否可以达到与真实世界别无二致的水平。这是一个主观测试,一个当今任何VR技术都无法通过的测试。尽管虚拟现实已经创造了一种强烈的临场感,能够以令人信服的方式将用户置身于虚拟场所,但它迄今远未达到令人不再怀疑面前一切是虚幻数字的程度。
扎克伯格的问题促使兰曼在2020年12月撰写了一份广为传阅的内部备忘录:“Passing the visual Turing test(通过视觉图灵测试)”。
其中,他为实现所述目标制定了详细的路线图,而如果成功实现,这将开创一个全新的虚拟现实赋能世界:从令远程工作与在真实办公空间中工作一样高效甚至更高效,到令你感觉真实地与他人共在,再到如同身临其境的虚拟旅游,未来的虚拟现实将能复刻我们今天在现实世界中所做的一切。
由VR驱动的远程工作将允许更多的人自由选择生活在任何地方,不必搬到公司的所在地。这将为个人和企业创造全新的机会,因为个人的就业机会将不再受地理位置的限制,而企业则可利用巨大的全球人才库。但改变游戏规则的影响将超越生产力。VR与AR一样都有望改变世界,它们甚至具有远超个人计算机的潜力,而难以区分的真实视觉体验将在其中发挥巨大作用。
在今天的博文中,我们将详细介绍DSR构建显示技术堆栈的探索。结合与Codec Avatars、逼真触觉反馈和空间音频等Reality Labs的项目,它们将有助于通过在所有视觉体验中迎接视觉图灵测试的挑战,并实现一个逼真的未来元宇宙。
我们将关注DSR正在开发的核心技术,讨论推动DSR进步的原型方法,并分享第一次感知研究的结果。最后,我们将介绍DSR的几个原型的详细信息,并已原型设计Mirror Lake收尾。提前剧透,Mirror Lake将DSR在多个研究领域的工作集成到了一个具有轻质、舒适外形的下一代头显装置之中。
这是一个科学探索的故事,一个研究概念的种子。它已经成长为一个全方位的项目,并在未来有望改变我们的工作、娱乐和交流方式。所述故事的开始将从它的挑战开始。
2. 挑战
对于DSR在追求视觉真实感的过程中所面临的挑战,我们非常容易可以将其总结出来:通过视觉图灵测试所需的技术尚不存在,尤其是对于消费者头显而言。尽管Quest和Quest 2实现了引人入胜的3D视觉体验,但它们尚不能与我们在现实世界中的体验相媲美。
当前明显的限制是分辨率,但其中挑战要更为深入。VR引入了一系列当今2D显示器所不存在的新问题,包括视觉辐辏调节冲突、色差、视差和瞳游。所以,在接近完全真实的VR视觉体验之前,我们需要克服一系列的障碍,需要进行大量的研究和大量的用户研究。缩小差距所需的创新分为几个大类。
首先,分辨率是一个问题。问题是,VR头显的视场比最宽的2D显示器都要大,所以无论可用的像素是什么,其都必须在比2D显示器更大的区域内应用,从而导致给定数量像素的分辨率较低。例如对于人类视场的20/20视觉,整个水平方向需要大约13000像素,这远远超过任何现有的消费者显示器(事实并没有那么糟糕,因为眼睛无法在整个视场中感知高分辨率,但挑战的程度依然适用)。
我们不仅需要更多的像素,而且像素的质量同样需要提高。今天VR头显的亮度和对比度大大低于笔记本电脑、电视和智能手机。所以,VR尚不能达到我们已经习惯的2D显示器的精细细节和精确表示水平。
然后,当前VR显示器中的透镜通常会扭曲虚拟图像,降低真实感(除非在软件中完全纠正扭曲畸变)。这是一个挑战,因为随着眼睛朝不同方向移动,扭曲畸变会发生变化。同时,尽管不属于真实感的范畴之内,但头显可能难以长时间使用,因为畸变问题以及头显的重量和形状参数都可能会导致暂时的不适和疲劳。
另一个可以归属于分辨率问题,但属于自己的领域类别的关键因素是:在任何距离都能正确聚焦的能力。我们将重点解释最后一点,因为这是我们今天故事的核心。
为了完全解决上述差距,扎克伯格和兰曼认为,通过视觉图灵测试需要构建一个全新的技术堆栈,包括:
- “变焦”技术提供了正确的焦距深度(相对于单个固定焦距),从而在手臂长度范围内长时间实现更清晰、更舒适的视觉
- 接近并最终超过20/20人类视场的分辨率
- 畸变校正有助于解决光学像差问题,如对象周围的彩色条纹和图像扭曲
- 高动态范围(HDR)技术扩展你在VR中可以体验的颜色、亮度和对比度范围
开发上述功能十分必要(但同时非常困难)。然而,这不够。所有一切最终都需要整合至适合消费者使用的舒适头显之中,这意味着DSR不仅要在多个显示领域提升技术水平,而且要构建远远超出当今水平的完整显示系统。扎克伯格认为,这是迈向下一代VR所必须解决的挑战。
显然,难度提升到了另一个水平。但这是DSR正在努力应对的问题。
兰曼指出这项任务的复杂性:“设计和制造融合这一系列技术的头显既困难又耗时,因为所有技术系统都相互关联。所有一切都在为同样的尺寸、重量、功耗和成本预算而竞争,并且同时需要适合的紧凑可穿戴形状参数。这不仅仅只是将所有技术压缩到一个紧张预算中的问题,堆栈中的每个元素必须与所有其他元素兼容。例如,特定的眼动追踪技术必须与特定类型的显示透镜搭配。”
DSR通过一系列广泛的原型研发工作来解决问题。然后对原型进行用户研究,以评估通过视觉图灵测试的进展。位于雷德蒙德的Reality Labs Research展示了这一切实成果:一堵满是原型的墙。它们共同探索下一代VR显示器的广泛技术,而这是DSR追求视觉真实感的生动历史。
在过去的七年中,兰曼的团队已经研发了二十多个全功能AR/VR研究头显,而每一个都是为了解锁新的演示和用户研究。
下面,我们将探索从一开始到今天的这段历史,依次研究四个主要技术轴中的每一个,包括多次讨论的变焦项目。同时,我们将讨论两种最新的DSR显示系统架构:Holocake 2(据我们所知,与Quest 2级别的所有头显相比,Holocake 2是光学结构最紧凑的一款,同时是第一款采用全息光学的设备)和Mirror Lake(为未来几代VR视觉体验提出的一种架构)。
我们首先回到2015年。
3. 变焦和关于双手作用的意外发现
2015年,兰曼新组建的团队开始研究与通过视觉图灵测试相关的显示技术。同时,Meta(当时称为Facebook)正在推出Oculus Rift,并很快推出了一种全新的交互方法:Touch控制器。它为VR带来了双手临在感。
兰曼相信,Reality Labs总有一天会带来超越Touch的交互技术,并带来当时团队已经在积极研究的手动追踪技术(2020年,我们为Quest增加了裸手交互)。
对于这个概念,兰曼产生了一个关键的见解:要最有效地使用双手,你必须能够聚焦于它们。这可能听起来很明显,很平常,因为我们在现实世界中就是这样子。然而,这对VR而言则不然。在现实世界中,我们不断改变眼睛晶状体的形状,使其聚焦在所见对象的距离,从而正确地成像从所述距离发出的光。
相比之下,当前的VR头显采用固定焦距的光学元件,其通常焦距为1.5到2米。这意味着,尽管我们没有意识到这一点,但在VR中,无论我们在场景中看向什么地方,光线总是来自相同的距离。这对于我们的视觉系统而言是一种新现象。在虚拟现实中,虚拟3D对象的模拟距离和聚焦距离之间的不匹配会导致视觉辐辏调节冲突(Vergence-Accommodation Conflict/VAC)。VAC是VR领域的一个众所周知现象,并可能会导致暂时的疲劳和视力模糊。它可能是长时间使用VR时所体验到的不适感的来源之一。扎克伯格在解释变焦优点时曾指出:“你的眼睛试图聚焦,但又无法聚焦,因为显示器的投影距离只有这么一段距离。”
解决VAC的一种方法是动态调整VR中的焦距深度,以匹配感兴趣对象的距离,从而令我们的眼睛能够在正确的距离聚焦。一种潜在的方法称为“可变焦距”,即在用户改变视线时相应地移动透镜。为了验证这一理论,DSR于2016年构建了一个巨大的验证原型,如下所示。我们将这类原型称为“时间机器”,它不是为消费者准备,而是为了探索可能性而构建的时间机器。它们是DSR探索未来VR视觉技术所不可或缺的重要环节。
4. 首个同类用户研究和Half Dome的演变
在2017年访问RL Research时,扎克伯格体验了一系列的原型,并就公司未来应采取的技术方向做出了决定。那天他尝试的第一个VR演示是我们在变焦方面的首批尝试。扎克伯格很快认可了这个可以提高近距离对象清晰度的庞然大物。所述原型和其他早期原型表明,变焦的基本原理可以发挥作用,并在主观上提供更为清晰的视觉体验。尽管富有前景希望,但团队缺乏确凿的证据证明DSR的变焦能够克服VAC,并提高敏锐度和舒适度。
DSR团队的视觉科学家玛丽娜·扎诺利(Marina Zannoli)在用户研究中找到了答案。她首先提出了一个令人生畏的工程挑战:研究小组必须制造一款重量和形状更接近Oculus Rift的新头显,从而避免研究受到佩戴笨重原型所带来的普遍不适感影响。对于2450克的头显,这意味着将重量减少四倍,同时改进设备以消除变焦系统产生的噪音和振动。
九个月后,团队交付了Half Dome Zero,这是一款680克的研究原型,与当时Rift支持的每一款VR游戏都完全兼容,但可以通过变焦技术提供适当的聚焦深度。尽管比470克的Rift重,但玛丽娜认为这款新头显足够轻,可以帮助感受用户偏好和变焦的真正优势。
接下来,玛丽娜必须决定如何测试变焦的预期优势,包括它是否能提高近距离对象的清晰度,是否能帮助人们更快地感知3D场景,是否能提高视觉舒适度,以及最重要的是,人们是否真的喜欢它。
玛丽娜决定采用一种与标准视觉科学方法截然不同的方法:使用有限的刺激,如眼图。她选择以丰富的VR体验为基础,并与一个技术美术团队合作,共同开发基于游戏技术的定制演示应用。然后,鼓励被试将大部分时间花在观察近距离对象(由于固定焦点VR的已知局限性,建议VR开发者避免这种情况)。
现在,玛丽娜配备了合适的头显和精心设计的方案,并邀请了63名被试完成为期两天的实验,从而评估相对于固定焦点VR的变焦系统。一天,变焦技术在Half Dome Zero完全启用,而另一天则选择固定焦距模式。被试需要填写一组问卷以主观评估各种偏好。
研究结果比团队最初猜测的更为积极。玛丽娜总结道:“当我们观察结果时发现,人们在使用变焦时在各个方面都更加舒适。他们经历的疲劳、恶心和视力模糊更少,能够更好地识别小型对象,阅读文本更容易,对视觉环境的反应更快。”最有希望的是,大多数被试更喜欢变焦而不是固定焦距。这是一个特别令人惊讶的结果,因为Half Dome Zero是一个早期原型,采用了不完善的眼动追踪和畸变校正软件。
所以到2017年夏天,DSR终于有了确凿的证据来证明变焦技术可以为VR带来一系列的性能和舒适性增益。法国国家信息与自动化研究所、加州大学伯克利分校和斯坦福大学的同期研究支持了这一结论。所以团队确信,解决剩余的众多工程挑战(包括眼动追踪、计算机图形学、光学设计、控制系统和重量)是当务之急,因此在接下来的五年中,DSR制造了一系列突破变焦技术极限的原型。
5. 变焦之外:视网膜分辨率、无畸变显示和HDR
兰曼指出:“Half Dome系列是我们团队的转折点。它帮助我们提升了变焦技术的最新水平,同时为我们的其他显示研究项目提供了一个模板。”
在Half Dome之后,DSR开始沿着同一条道路指导他们的所有研究工作。这一过程从确定技术要求和假设开始,然后构建巨大的验证时间机器,创建完善的概念验证原型,最后进行用户研究,生成关键数据,并为下一个原型提供信息。
他补充道:“我们已经将这一蓝图严格应用于视觉图灵测试的其他维度,尤其是分辨率、光学畸变和高动态范围。”
下面我们来深入研究这三个领域,看看DSR的研究正处于什么阶段。
6. Butterscotch:理解“视网膜分辨率”
“视网膜分辨率”长期以来一直都是屏幕产品的黄金标准。尽管没有普遍接受的定义,但行业通常认为它大约是每度60像素(ppd),足以在眼图描绘20/20。尽管大多数笔记本电脑、电视和手机早就通过了这一门槛,但VR却远远落后,因为它的沉浸式视场将可用像素扩展到了更大的视觉范围。例如,Quest 2的显示器只提供大约20ppd。
这显然限制了呈现精细文本和其他细节的能力,同时限制了感知的真实感。例如,日本的研究人员表明,随着图像分辨率的提高,真实感将稳步增强,一直可以到120 ppd左右,远远超过所谓的“视网膜”分辨率。由于视觉真实感是视觉图灵测试的核心,DSR多年来构建了一系列高分辨率VR原型,从而探索VR环境下视网膜分辨率的重要性,并寻找实用头显能够达到这一水平的方法。
在2021年扎克伯格和博斯沃思访问Reality Labs Research时,这一原型的价值出人意料地获得了加强。在从机场开车过来的路上,扎克伯格询问亚伯拉什团队在视网膜分辨率方面的进展。亚伯拉什回答道,你很快就会知道,因为在几个小时内你就会戴上Butterscotch,这是DSR最新和最先进的视网膜分辨率原型。
Butterscotch是原型设计的一个优秀例子,可以帮助你快速地、直接地感知答案。目前没有任何面板能够以标准VR视场支持视网膜分辨率,所以团队使用了3K LCD面板,并将视场限制在Quest 2的一半左右,从而将分辨率提高到55 ppd(Quest 2的两倍半)。然后他们必须开发一种新型混合透镜来解析如此高的分辨率。
其结果离消费者产品非常遥远:太笨重,视场太小。但它允许扎克伯格体验到接近视网膜分辨率的体验,并亲自看到它产生了多大的差异。这正是DSR时间机器的设计目的。事实上,在演示Butterscotch并认识到其视网膜分辨率技术对虚拟现实的未来至关重要之后,扎克伯格指导了一次集团级别的分辨率路线图审查。
团队在VR分辨率的道路中还有很长的路要走,但Butterscotch是重要的一步。它同时可以作为将其他DSR技术集成到高分辨率显示系统中的基础。例如,DSR正在构建Butterscotch的变焦技术变体,其分辨率将是Half Dome Zero原型的三倍以上。对于固定焦点,模糊会发生在远离焦平面的地方,所以变焦式Butterscotch有望评估变焦技术在人类视觉极限附近的全部视力优势。
7. 消除VR头显中的光学畸变
VR视觉体验的分辨率很重要,但这只是拼图的一环。图像质量同样重要。由于各种技术原因,任何VR透镜都无法完全消除光学像差。有些像差可以通过在软件中扭曲图像来纠正。这是当今几乎所有VR头显的关键要素,正确使用它是实现出色视觉体验的关键。
然而,现有VR头显中的畸变校正软件并不完美;校正是静态的,但虚拟图像的畸变是动态的,会根据视线位置而变化。如下面所示,这种称为瞳游的现象会令VR看起来不太真实,因为当眼睛移动时,一切都会移动一点。使用变焦技术时,这一点变得更加重要,因为随着显示器焦距的变化,图像会略微放大和缩小。
得益于2017年Half Dome Zero用户研究中的一个错误:意外关闭了变焦技术的畸变校正,团队很早就意识到了准确变焦畸变校正的重要性。他们纠正了这个错误,并在这个过程中发现,只有在正确应用透镜畸变校正的情况下,变焦技术才能显示出显著的优势。这突出了正确校正畸变的重要性。但随着团队深入研究,他们又很快发现,缺乏进行校正所需的工具。
问题是畸变研究需要很长时间才能建立;仅在定制头显中制作透镜可能需要数周或数月的时间,而对于只是构建可用于测试的功能性头显显示器而言,这只是漫长过程的开始。DSR意识到他们需要以光学设计软件而不是透镜制造硬件的速度进行畸变研究。
他们解决了这个问题。团队重新利用3D TV技术创建了一个VR透镜畸变模拟器,从而诱发精确控制的畸变。这允许研究人员立即研究任何透镜设计的畸变校正算法(DSR将在8月的SIGGRAPH大会展示解决方案)。
凭借这一独特的快速原型制作能力,团队首次能够进行用户研究,调查眼动追踪畸变校正。与当今头显中的校正软件不同,动态畸变校正利用眼动追踪来更新渲染的校正,这有可能产生今天静态校正所不能产生的始终稳定图像。
快速原型技术有望大大加快对VR透镜畸变和各种校正的研究,为未来VR头显减少畸变铺平道路。
8. Starburst:预览高动态范围头显
分辨率、畸变校正和变焦都是高级视觉真实感的关键支柱,但高动态范围(HDR)是唯一一种与增强真实感和深度联系最紧密的技术。HDR是指对各种亮度、对比度和颜色的支持。
“NIT”是描述对象发出多少光的单位,室内环境的典型值远远超过10000 NIT,如下所示。在以前,一台典型的电视机亮度只有几百 NIT。但在2013年,杜比实验室的研究人员使用定制显示器进行了一项用户研究,其显示器的峰值达到20000 NIT,并发现峰值亮度的最佳点约为10000 NIT。这项开创性的研究激发了电视行业在过去五年中开发和引入HDR显示器,并取得了巨大成功。
VR尚未实现这一飞跃。Quest 2的峰值亮度约为100 NIT,在VR头显的功率、散热和形状参数限制下,要想远远超过这一点并不容易。正如扎克伯格去年在一次采访中所解释的那样:“在显示器和使其变得超级逼真方面,最困难的挑战可能是HDR问题。电视最近在HDR出现了一定的进步。但与眼睛在现实世界中看到的屏幕相比,我们所看到的屏幕逼真度尚差一个数量级或更多。”
现代VR头显中使用的LCD面板和透镜的对比度低于电视屏幕,进一步降低了真实感,而增加亮度往往会放大问题,洗掉较暗的颜色,尤其是黑色。最后,今天的显示器只能显示人眼能够感知的全部色域子集。DSR研究人员正在制造HDR VR头显原型。DSR研究科学家松田内森(Nathan Matsuda)说道:“我们最新的Starburst体积大、重量重,而且是系留头显,你必须像使用一副超大双筒望远镜一样把它举到脸上。但当这样做时,你会感受到前所未有的体验:一个可以再现室内或夜间环境中通常遇到的全部亮度的演示内容。”
用自己的眼睛直接体验HDR无可替代,所以DSR将于8月在SIGGRAPH大会演示Starburst。同时,DSR正在遵循其通常的模板,构建改进的HDR头显,将其作为用户研究的工具。通往真正的HDR VR显示器的道路很长,但DSR已经开始了这一旅程,并将在途中提供团队的进展。
9. 实现阶跃式进化
经过多年的演示和用户研究,DSR确信视网膜分辨率、变焦、准确的畸变校正和HDR对于通过VR视觉图灵测试至关重要。他们已经构建并验证了分别提升了视觉真实感的各个方面的原型。但最终的回报实际将是把它们整合到在一个小巧的头显之中。
问题是,VR头显需要紧凑、轻便和时尚,而实现DSR技术所需的额外硬件往往与其相反。兰曼表示:“经过近七年的高性能变焦头显开发,我们的机械工程师始终发现,任何引人注目的变焦系统都会增加40到50克左右的重量。看起来可能不多,大约是两节AA电池的重量,但这意味着要求用户接受比Quest 2至少重10%的头显。
这正是DSR研究科学家安德鲁·梅蒙(Andrew Maimone)发挥用武之地的时候。梅蒙的研究重点是尽可能减少现有VR的尺寸、重量和功耗。他指出:“尽管我们从早期的原型中学到了很多,但在大型、笨重的体验式试验台通过视觉图灵测试只是最终以你渴望的时尚、轻巧形状参数交付所述技术的第一步。这就是为什么我们依然在构建架构原型,探索如何将所有元素浓缩成可交付的产品。”
10. Holocake:你能小型化到什么程度?
梅蒙领导开发了扎克伯格和博斯沃思去年秋天在雷德蒙德体验过的一款原型:名为Holocake 2的超小型头显。
将全息和Pancake光学元件相结合,这是我们在2020年撰文介绍Holocake时首次讨论的一种方法。Holocake 2是我们制造过的最薄、最轻的VR头显。与最初的Holocake不同,Holocake 2是一款全功能PC系留设备,能够运行任何现有的PC VR内容。Holocake看起来像一副太阳镜,但缺少关键的机械和电气组件,光学性能明显低于当今的消费类VR头显。
对于Holocake 2如何实现其超紧凑外形,我们先快速过一遍VR显示器的构造方式。今天的VR显示器依赖于光源、通过调光或增亮照明形成图像的显示面板,以及将光线从显示器聚焦到眼睛的透镜。通常,透镜需要离显示器数英寸的距离,以便有足够的聚焦能力将光线引导到眼睛之中。
但如上所示,存在令透镜更靠近显示器的方法,从而大大减小耳机的尺寸。Holocake 2采用两种技术来实现这一点。首先,它用全息光学元件代替透镜。全息光学元件像透镜一样弯曲光线,但形状像一块薄而透明的玻璃板。其次,它实现了基于偏振的光学折叠(模拟Pancake透镜,但全息光学的形状参数要小得多),以显著缩短从显示器到眼睛的光路。
这听起来像是一种几乎完美的“减肥”方法,但常识告诉我们事情一定没那么简单。最大的问题与光源有关。Holocake需要专用激光器,而不是现有VR产品中使用的LED。梅蒙指出:“如今,激光非常普遍,但大多数消费类产品的激光器在性能、尺寸和价格都不符合我们的要求。所以,我们需要进行大量的工程工作,以实现一种符合我们规格、安全、低成本、高效、适合消费者、并且可以安装在纤薄VR头显中的激光器。”
到今天为止,合适的激光源尚没有定论,但如果证明可行,如同太阳镜般的VR头显将有一条明确的道路。
11. Mirror Lake:将一切整合在一起
DSR的多个研究方向都源于一个核心理念。正如兰曼所言:“之所以将自己命名为‘显示系统研究团队’,是因为我们知道除非我们开发出令人信服的实用架构,否则所有的演示和用户研究都将一文不值。”
这是DSR的核心工作:不断寻找解决方案,以将所有一切结合在一起,从而创造能够通过视觉图灵测试的下一代视觉体验。不仅是单纯的塞到一起,而是以一种优雅的方式带来真正的用户价值。
Holocake 2就是这一理念的产物,一个类似滑雪镜的概念原型。团队从Holocake 2的基本架构开始,不断加入在过去七年中的各种研究成果。
Mirror Lake展示了Holocake架构的可能性。例如,可以添加Half Dome 3的纤薄电子变焦模块,从而解决视觉辐辏调节冲突,并且不会显著增加头显的厚度。个人视力矫正不需要巨大的配镜,只需附加另一个薄透镜,甚至将佩戴者的视力矫正参数直接烘焙到Holocake主透镜所使用的全息图即可。太阳穴位置中有一对前置摄像头,可以实现机器学习驱动的Passthrough(DSR将在SIGGRAPH大会展示这项研究)。
眼动追踪已经成为通过视觉图灵测试的关键要素,因为它对于变焦和动态畸变校正都是必需项。Mirror Lake架构开创了一种新的方法,使用全息薄膜将光线从眼睛重定向到一对摄像头。这种新方法同时可以实现多视点眼动追踪,从而显著提高准确性。
这里的关键是:多亏了全息技术,一切都变得又薄又平。变焦模块十分扁平,用于Holocake的视力参数矫正和眼动追踪的所有全息薄膜同样扁平。另外,你可以非常容易继续添加精简的、扁平的技术。这一点在已经在早前演示的反向透视显示器中得到了证明:只需在光学堆栈中放置另一个平面3D显示器,即可将其集成到Mirror Lake设计之中。
Mirror Lake的概念非常具有前景,但目前它只是一个概念,尚没有全功能头显来最终证明其架构。但如果真的成功,它将改变VR视觉体验的游戏规则。
12. 通过视觉图灵测试的漫长道路
但以上只是通过视觉图灵测试漫长道路的又一步。开发通过这项测试所需的技术,并找出如何将其转变为满足数百万人需求的头显,这将是一个多年的旅程,而且其间潜伏着众多陷阱,并且存在大量需要学习和解决的问题。DSR深知这一挑战,并致力于实现真正的视觉真实感。他们迄今为止的努力使他们和扎克伯格相信,这一目标最终可以实现。
正如扎克伯格之前所说:“当你憧憬10年之后,显然你希望(头显)的形状参数变得更小。理想的情况是达到与视网膜显示器几乎相同的程度。”
视网膜分辨率、变焦和HDR重要性的框架来自于多年来DSR的努力,投资于所述技术,亲眼看到它们的优势,然后为每种技术创建一条切实可行的前进道路。
兰曼最后说到:“激光最终可能会证明对VR而言不切实际,至少对于Holocake的形态而言是这样。在这种情况下,Mirror Lake的整个纸牌屋都将倒塌。这就是发明依赖新兴技术的全新显示系统的挑战。但确保你到达理想目的地的最佳方法是挖掘多条通达路线,而Mirror Lake只是DSR的研究方向之一。无论如何,无论我们走哪条路,我们的团队都确信,通过视觉图灵测试是我们的目标,物理层面没有什么能够阻止我们达到目标。在过去的七年中,我们已经预见到了未来,我们依然全力致力于找到一条通往视觉真实感元宇宙的实用道路。”