Meta研究基于眼睛跳动的渲染算法,为高分辨率显示节省>50%带宽
可以为高分辨率显示器节省>50%的带宽(>60像素/度)
(映维网Nweon 2024年07月18日)人类的眼睛十分好动。无论怎样专注,眼球都无法保持一动不动。它们总是在轻微地转动,只是我们几乎毫无察觉。这样的眼动又称作“微眼跳”(microsaccade),平均每秒一两次,一天大概数万次。
延伸阅读:马里兰大学介绍人眼工作原理启发的摄像装置,极端光照下具有性能、低延迟、低功耗优势
延伸阅读:降低计算功耗,苹果为AR/VR申请眼动追踪专利
基于这一原理,业界正积极探索以人眼系统作为灵感来源的眼动追踪系统,包括Meta。
感知优化压缩技术通常用于解决渲染、功率、带宽、存储和成本限制问题,同时在传统直视显示器的各种应用中最大限度地减少对感知图像质量的影响。
头显在上述所有方面都带来了额外的计算挑战。基于人类视觉系统对外围视觉不如中心敏感的事实,业界已经提出了基于眼动追踪的注视点渲染。
然而,用于注视点渲染的眼动仪对功耗提出了要求。所以,如何优化这一点成为了团队关注的一个问题。
眼跳期间的视觉输入会遭到抑制以隐藏视网膜运动模糊是一种众所周知的现象,这又称为眼跳抑制。值得注意的是,视觉敏感度不会在完成眼跳后立即恢复。
换句话说,在扫视,眨眼和眼跳期间,用户的视觉敏感性会暂时抑制。针对这一点,Meta提出了一种利用这种现象的渲染算法。
团队发现,在眼跳完成后空间敏锐度显著降低,随后在100-200毫秒内迅速增加。在这一期间,头戴式装置的控制电路可利用视觉灵敏度的瞬时抑制来对显示器的操作进行调整。例如,控制电路可以将显示器的操作与视觉灵敏度抑制周期相协调,以降低功耗和/或进行潜在的侵扰性图像改变。
简单来说,当我们进行快速扫视时,视觉系统将进入“瞎眼”状态。你能够看到扫视的起点画面和终点画面,但无法看清期间的画面。眨眼则更容易理解,你在闭眼期间无法获取感知视图。
所以,可以分析来自眼动监控系统的注视追踪数据并确定视觉中断事件的开始和持续时间,如眨眼或扫视。然后可以在视觉中断事件期间暂停向用户呈现图像或降低亮度,并且在视觉中断事件结束时恢复图像,从而确保用户能够及时地看到图像。
通过利用眼动追踪来确定扫视或眨眼的开始和持续时间,系统可以在这一期间暂停向用户呈现图像或降低亮度或执行其他操作,从而降低计算成本和设备功耗。
Meta指出,他们提出的眼跳渲染算法可以为高分辨率显示器节省>50%的带宽(>60像素/度)。另外,团队人员在30张自然图像的受控和可复制的心理物理实验中评估了眼跳渲染,并确认了算法的可行性。