斯坦福、英伟达和MIT团队提出显著改善全息图像质量的解决方案
显著改善了图像质量和光通量
(映维网Nweon 2024年12月03日)新兴的全息显示技术为下一代虚拟现实和增强现实系统提供了独特的功能。然而,目前的全息近眼显示器只支持一个小可变空间,从而导致了在视场和视窗尺寸之间的直接权衡。
尽管行业已经在探索Étendue Expansion光学扩展量扩展,但现有的方法要么在可实现图像质量方面受到根本限制,要么需要极高速的空间光调制器。
日前,斯坦福大学,英伟达和麻省理工学院的团队描述了一种显著改善了图像质量和光通量的全新扩展方法,并计划在2024月12月举行的SIGGRAPH ASIA大会进行介绍。
概括而言,所述该方法将多个相干源与傅里叶平面全息图频谱的内容自适应幅度调制相结合。为了给间光调制器生成时间复用相位和振幅模式,团队设计了一种基于瞳感梯度下降的计算机生成全息算法,并由大基线目标光场监督。
与相关的基线方法相比,所述方法在模拟和实验全息显示原型中显示了显著改善的图像质量和光通量。
全息近眼显示器为虚拟现实和增强现实应用提供了独特的优势。例如,全息显示器可以以轻量级设备形式向用户呈现具有自然视差的感知逼真3D图像。
然而,全息显示器的光通量从根本上受限于底层空间光调制器(SLM)的像素数,这使得当前的全息近眼显示器无法同时获得大的视场和视窗。所述限制是全息显示器成为实用显示技术的根本障碍。
增加SLM的像素数似乎是一个自然的解决方案。但对于当今的硬件解决方案而言,开发相匹配的大面积纯相位SLM根本不可行。为了克服这个问题,一系列的研究人员探索了各种扩展技术,但都有其局限性。
团队指出,以前的扩展技术有以下缺点:
- 基于掩模的扩展技术重建低对比度和斑点图像。
- 使用多光源可以扩大视窗,但光场重建质量较差。
- 转向照明配置可以获得不错的图像质量,但由于需要大量的时间复用帧,这种方法只能使用高速SLM来实现。
斯坦福大学,英伟达和麻省理工学院希望全息显示器可以有足够的自由度来同时实现大视场和视窗。
在没有高分辨率SLM的情况下,这只能通过转向或多源照明来实现。研究人员通过在SLM之后的傅里叶平面中引入动态的可编程调幅机制来解决主要缺点。通过将傅立叶平面全息图频谱的内容自适应调幅与多个相干源相结合,系统在使用更少时间复用帧的同时,在扩展的视窗中实现了最佳的图像质量。
这种独特的光学设置能够扩展转向/多源配置,从而以内容自适应的方式调制显示图像的频谱。为此,他们利用一种随机优化方法,将目标光场分解为一组时间复用相位SLM和相应的傅立叶振幅掩模以快速连续显示。
团队实现了所提出的三维全息显示设计,并对算法进行了评估。定制打印的3D支架用于容纳多源激光阵列。
他们使用可调光圈和可调焦镜头捕获系统显示的光场和焦点堆栈,而视差和对焦/散焦在拍摄结果中清晰可见。
如上图所示,研究人员比较了不同的调制解调器扩展全息显示配置,包括具有光场监督的传统设置(第一行),相位掩膜(第二行),多源(第三行),具有随机傅立叶掩膜的多源(第四行),转向(第五行),带滤波器的转向(第六行),以及团队所提出的具有内容自适应动态傅立叶调制的多源(第七八行)。
对于每个配置,将呈现中心视图(第一列),并在接下来的四列中插入两个焦点切片(后方和前方)和两个不同的视点(左侧和右侧)。所有方法都使用相同的大基线目标光场进行监督。
可以看到,斯坦福大学,英伟达和麻省理工学院团队的方法显著改善了图像质量。
当然,团队坦诚,他们是在台式显示器设置演示了相关的结果,所以接下来需要进一步努力使小型化系统。另外,多源激光阵列是使用笨重的分离器实现,而系统的帧率受到幅度显示的限制。同时,光场全息图的实时合成是实际全息显示器所必需的组成,但目前系统尚不支持。最后,他们没有尝试校准原型显示器的神经网络参数化波传播模型。
相关论文:Large Étendue 3D Holographic Display with Content-adpative Dynamic Fourier Modulation
总的来说,团队提出的新硬件设计和算法框架提高了全息显示的传输速率,并使光场全息图合成具有更好的图像质量。这将有助于帮助全息显示器成为更实用的技术。