研究人员提出3D视线预测技术，让AR设备预知抢先渲染场景

编辑：刘余欣 | 分类：论文 | 2026年6月2日

让AR设备预知抢先渲染场景

（映维网Nweon 2026年06月02日）美国佐治亚理工学院交互计算学院团队正在开展一项研究：从第一人称视角追踪并预测用户在3D环境中的视线轨迹。未来，AR眼镜或许能够主动预测用户的视线方向，并提供更流畅的交互体验。

目前大多数眼镜设备只能被动响应用户的视线方向，始终在“追赶”。团队的方法则能让设备提前预判，使体验更加无缝衔接。

研究人员解释道：“这使AR系统能够预判用户接下来会与什么交互、视线将转向何处，从而主动渲染体验。”

尽管已有研究基于2D静态图像预测用户视线，但她的工作是首次通过3D框架来解决这一问题。研究人员指出：“我们生活在3D世界中，人们会从多个视角动态移动，所以我们需要在3D而非2D空间中预测视线。我们所追踪的是一个人在空间中注意力的3D路径。”

团队提出了一种新的问题形式：在跨不同第一人称视角时保持一致的、并且植根于佩戴者3D环境中的坐标系中预测视线目标。为了应对第一人称视频的动态特性和视线的连续性，他们将过去的视频帧、头部姿态以及视线观测值作为任务的输入，并为这一任务开发了一种基于Transformer的架构。

......（全文 476 字，剩余 59 字）

wx_mp

请微信扫码通过小程序阅读完整文章
或者登入网站阅读完整文章
映维网会员可直接登入网站阅读
PICO员工可联系映维网免费获取权限