Facebook Reality Labs对球形麦克风阵列信号双耳渲染的传感器自噪声进行评估
对球形麦克风阵列信号双耳渲染的传感器自噪声进行评估
(映维网 2021年04月28日)在一份名为《Instrumental Evaluation of Sensor Self-Noise in Binaural Rendering of Spherical Microphone Array Signals》的论文中,由查尔姆斯理工大学和Facebook Reality Labs组成的团队对球形麦克风阵列信号双耳渲染的传感器自噪声进行评估。
球形麦克风阵列(SMA)可以使用大量的麦克风。例如,最近的开源HØSMA-7N阵列由64个传感器组成。麦克风信号可用于各种应用,例如波束形成器或旨在保持原始空间特性的再现。然而,每个麦克风都会产生并贡献一定量的传感器自噪声,这就提出了一个问题,即阵列处理输出信号的信噪比(SNR)是多少。对于再现的目标声场,显示约8阶或更高阶的球谐渲染所产生的双耳信号与实际ground truth耳信号几乎无法区分。阵列传感器中所需的目标信号(即除不需要的附加噪声以外的任何信号),是冲击阵列表面的波的结果。所以,它们是通过波动方程联系在一起,麦克风之间相干,自噪声之间非相干。
正如理论预测的一样,随着麦克风数量的增加,信噪比将随之提高。假设所有麦克风产生相同数量的噪声,业界研究评估了白噪声增益(white-noise-gain ;WNG)对阵列和处理管道配置的依赖性。为了限制径向滤波器的增益,业界提出了不同的方法。在实时实现中,麦克风的数量以及径向滤波器对双耳信号中噪声的产生水平和频谱特性的影响最大。SMA数据的呈现可以基于实时捕获的阵列信号或测量的脉冲响应数据集来执行。后者可以称为阵列房间脉冲响应(array room impulse responses,ARIRs),并编码单个声源和周围环境的静态表示。相关数据集可以从实际的多通道SMA中获取,同时可以从单个麦克风的连续测量中获取。通过基于扫描的采集方法,测量信号中的噪声对产生的IRs的影响可以通过调整扫描持续时间,以及对多次采集进行平均化来很好地控制。
遗憾的是,这种噪声抑制技术不适用于从实时捕获或记录的麦克风阵列信号呈现流数据。SMA传感器数据的连续流允许对动态场景进行编码,包括任意数量的移动源、环境条件的变化和SMA本身的位置。如果目标源具有低电平,则需要对来自SMA的信号进行高总体放大,从而固有地提高由传感器产生的绝对噪声电平。所以,环境噪声和传感器自身噪声的存在对呈现流式SMA信号是一个特殊的挑战。在这篇论文中,团队使用实时球面阵列渲染器(ReTiSAR)来确定实际相关配置的耳信号的信噪比。特别是,研究人员评估的信噪比在选定的SMA参考传感器对双耳输出信号。另外,团队根据渲染管道的参数概述渲染自噪波的光谱属性。所获得的见解对于为特定应用定制阵列设计和确定有利的动态范围非常有用和重要。
传感器自噪声是球形麦克风阵列设计中的一个重要方面。论文主要研究球面传声器阵列信号的双耳再现。研究人员使用实时球面阵列渲染器(ReTiSAR)来分析与频率相关的白噪声增益,即阵列中选定麦克风与双耳输出信号之间信噪比(SNR)的改善。阵列的结构及处理管道已被证明能够强烈地影响双耳信号的频谱特性和噪声的总体水平。团队发现,除非对径向滤波器增益施加严格限制,否则小半径阵列可将信噪比降低约8db。一些具有较大半径和麦克风数量(高于球谐4阶)的阵列配置能够将渲染信号中的信噪比提至最高9 dB。