Meta研究探索可佩戴麦克风阵列在噪声动态环境中的DOA估计问题

编辑：广东客 | 分类：论文 | 2022年11月11日

探索了可佩戴麦克风阵列在噪声动态环境中的DOA估计问题

（映维网Nweon 2022年11月11日）对于AR/VR，定位用麦克风阵列记录的多个声源是一项重要任务。所以，社区已经为这项任务开发了众多到达方向（DOA）估计方法，包括基于波束成形的方法、子空间方法和到达时延估计方法等等。大多数基于所述方法的算法设计都假设自由场环境。当算法用于更常见的混响环境时，它们的DOA性能会下降。

这是因为在混响环境中，房间反射掩盖了携带DOA信息的直接声音。当然，最近社区开发了数种对混响鲁棒的多扬声器DOA估计方法。一种这样的方法在时频域中处理麦克风信号，并采用直接路径优势（DPD）测试来识别由源的直接声音主导的时频bin。然而，它们假设声源和麦克风阵列都是静止，而在声源和/或麦克风阵列移动的动态环境中，相关算法的研究较少。在动态环境中，声源和/或麦克风阵列的运动可能导致DOA在时间上快速变化。因此，为了准确地追踪DOA，需要在连续DOA估计之间的短间隔。另外，可以使用追踪算法来及时平滑DOA估计。

尽管社区已经开始研究动态环境中的DOA估计和追踪算法是，但它们都没有包括可佩戴麦克风阵列的实验。随着AR应用的普及，这样的场景会越来越流行。所以，以色列本·古里安大学的研究人员探索了可佩戴麦克风阵列在噪声动态环境中的DOA估计问题。

实验使用Easy Communication（EasyCom）数据集进行。DOA估计是使用一种计算效率高的算法计算，它在静态混响环境中具有良好的源定位性能。所述算法结合了DPD测试，并在时频域中运行。团队研究了算法在不同操作参数下的性能和局限性。

团队首先简要介绍了麦克风阵列在每个时频段（t，f）捕获的记录信号的假设模型，然后描述了用于每个bin（t，f）处DOA估计的Local Space Domain Distance（LSDD）算法。

信号模型

......（全文 2377 字，剩余 1734 字）

wx_mp