研究:利用相位偏折术革新眼动追踪,精度提升3000倍达0.1度
高精度追踪人眼
(映维网Nweon 2025年04月07日)眼动追踪在AR/VR头显中发挥着至关重要的作用。然而,高精度追踪人眼是一项艰巨的挑战。
在一项研究中,美国亚利桑那大学、瑞士苏黎世联邦理工学院和美国西北大学的研究人员展示了一种或会彻底改变眼动追踪的创新方法。
通过将一种名为相位偏折术的强大3D成像技术与先进的计算相结合,这有可能显著改善最先进的眼动追踪技术。
研究人员表示:“目前的眼动追踪方法只能从数个稀疏的表面点捕获眼球的方向信息,最多十二个。通过我们基于相位偏折术的方法,我们可以使用来自4万多个表面点的信息,理论上甚至是数百万个,所有信息都是从一张单一的瞬时摄像头图像中提取出来。更多的数据点提供了更多的信息,可以潜在地用于显著提高注视方向估计的准确性。”
他们补充道:“这对于实现下一代虚拟现实应用至关重要。我们已经证明,与传统方法相比,我们的方法可以轻松地将获取的数据点数量增加3000多倍。”
作为说明,相位偏折术(Deflectometry)是一种非接触式、低成本、高鲁棒性且高精度的面形测量技术。通过测量结构光在待测物体表面反射后的畸变情况,它可以重建物体的三维形貌。相位偏折术具有测量角度大、非接触、精度高、速度快等特点,适用于平面、球面、非球面、离轴抛物面、自由曲面等多种面型的高精度检测。
在工业表面检测之外的应用中利用相位偏折术是亚利桑那大学的主要研究重点。他们致力于将其与用于计算机视觉研究的先进计算方法相结合。所以产生的解决方案则称之为“计算偏折法”,而相关应用包括眼动追踪等等。
在研究中,研究小组对人类被试和一个逼真的人造眼睛模型进行了实验。他们测量了研究对象的视线方向,并能够以0.46到0.97度的精度进行追踪。在人造眼睛模型进行测试时,误差仅为0.1度左右。
这种新方法不是依靠数个红外点光源从眼睛表面反射中获取信息,而是使用显示已知结构光模式的屏幕作为照明源。所以,屏幕超过100万个像素中的每一个都可以作为一个单独的点光源。
研究人员解释道,通过分析显示图案在眼睛表面反射时的变形,研究人员可以从眼睛获得准确而密集的3D表面数据。
他们指出:“我们的计算重建然后使用相关表面数据和已知的眼睛光轴几何约束来准确地预测注视方向。”
在之前的一项研究中,团队已经探索了技术如何与虚拟现实和增强现实系统无缝集成,方法是在头显框架或头显本身的视觉内容中使用固定的嵌入式图案,并作为从眼睛表面反射的图案。
研究人员指出,这可以显著降低系统的复杂性。另外,这项技术的未来版本可以使用红外光代替可见光,以便系统在运行时不会因可见图案而分散用户的注意力。
团队指出:“为了从眼睛的角膜和巩膜获得尽可能多的方向信息,我们使用了立体相位偏折术和新的表面优化算法。这项技术不需要像其他方法那样对眼睛的形状或表面做出强烈假设,就能确定注视。”
据研究人员所知,这是相位偏折术第一次用于眼动追踪。他们补充道:“令人鼓舞的是,我们的早期实现已经证明,在真实的人眼实验中,它的准确性与商业眼动追踪系统相当,甚至更好。”
相关研究正在申请专利,并计划进行商业化,从而为强大而准确的眼动追踪新时代铺平道路。研究人员相信,通过进一步的工程改进和算法优化,他们可以突破眼动追踪的极限,超越之前使用适合现实世界应用环境的技术所达到的极限。
接下来,团队计划将其他3D重建方法嵌入到系统中,并利用人工智能进一步改进技术。
相关论文:Accurate eye tracking from dense 3D surface reconstructions using single-shot deflectometr
他们解释道:“我们的目标是接近模型眼实验获得的0.1度精度水平。我们希望我们的新方法能掀起下一代眼动追踪技术的新浪潮。”