Oculus揭秘Touch控制器追踪技术：LED 匹配

编辑：广东客 | 分类：快讯 / 研发 / 精选 | 2019年11月5日

加入映维网会员

稳健的状态机，它允许我们能够在各种求解器之间进行转换

（映维网 2019年11月05日）映维网曾在九月分享了一篇关于Oculus Constellation追踪系统，其中负责AR/VR设备输入追踪的Facebook工程经理安德鲁·梅利姆（Andrew Melim）撰文介绍了他们是如何用基于Constellation追踪的控制器来提高交互保真度。日前，梅利姆再次撰文，并讲解了他们在最近版本更新中所采用的最新LED匹配方案。下面是映维网的具体整理：

延伸阅读：深入探索Oculus Insight如何提高追踪保真度，确保内向外追踪系统性能

1. 从二维blob到三维姿态

摄影测量中存在一个经典问题：Perspective-n-Point（PnP），亦即在给定图像及其里面的已知3D点的情况下识别camera姿态。我们要解决的问题是确保控制器追踪工作正常进行，而与PnP问题相反的是，我们已经能够很好地估算出头显camera姿态，但我们希望找到具有已知3D点（LED）的控制器姿态。

一旦检测到摄像头成像中的每个红外LED，我们需要解决的困难是确定从每个blob到控制器特定LED的映射。我们利用LED位置及其到blob的映射来确定控制器的位置和方向。由于我们仅使用头显数据来执行跟踪，所以我们必须高效地执行这一过程的每个部分。

计算机视觉中的Blob是指图像中的一块连通区域，Blob分析就是对前景/背景分离后的二值图像，进行连通域提取和标记。标记完成的每一个Blob都代表一个前景目标，然后就可以计算Blob的一些相关特征，如：面积、质心、外接矩形等几何特征。同时可以计算Blob的颜色、纹理特征，而它们都可以作为追踪的依据。基于Blob的追踪属于基于区域的追踪。

在将blob与LED匹配的过程中，我们围绕可能正确的潜在匹配生成一组假设。为了计算出准确的姿态，我们需要最少的匹配项。我们的算法能够根据我们处理的各种变量来从概率方面确定最可能的正确匹配。不正确的映射会纳入直接导致姿态估计不准确的错误，所以我们需要在每帧中获得足够的准确匹配。

2. 用多视图来优化匹配

为了解决LED匹配问题，我们实现了在每帧上运行的多种方法。但广义上讲，它们分为两个主要类别。第一是穷举方法，亦即强制应用解决方案，而我们通俗地将其称为“暴力匹配”。当没有关于控制器位置和方向的先验信息时，我们就会使用这些方法。当从前一个摄像头图像中获得控制器的姿态时，我们就可以在更小的窗口内进行搜索，而我们将其称为“接近匹配”。

在一开始，管道一次搜索一个camera中的blob。这要求假设生成blob和验证blob都在同一个camera中，亦即意味着一个camera中至少要检测到4个blob才能成功匹配。另外，它非常有可能导致多个camera之间产生矛盾匹配结果。为了解决这个问题，我们开发了全新的匹配管道：在评估不同camera中的LED-blob对应关系时，它将利用立体摄像头校准数据。这使我们能够依靠每个摄像头之间的关系来帮助解决不确定性。

Oculus揭秘Touch控制器追踪技术：LED 匹配