Facebook研究为空间音频进行更好的信号增强
语音处理
(映维网 2021年11月04日)近年来,使用空间处理算法从干扰扬声器、混响和/或环境噪声所造成的噪点环境中提取清晰语音的能力一直备受追捧。从仅提取感兴趣信号中获益的常见用例包括自动语音识别、助听器信号增强、在线语音聊天、视频会议及其他众多应用,例如在嘈杂的餐厅中实时增强语音。
业内认为,跨数据方法是降低信号噪点的稳健解决方案。例如,在空间信号增强领域,人们已经广泛研究了波束形成器的算法(如延迟和求和算法)和超定向算法(如最大方向性和差分麦克风阵列)。
其他更为优化的方法需要源和非期望噪点的统计知识。最小方差无失真响应(MVDR)和线性约束最小方差(LCMV)等方法提供了分离两种类型信号的最佳滤波器系数,同时不会使所需信号失真。LCMV公式允许对多个传递函数(如果可用)进行线性约束。仅依赖于期望或非期望的推断以及两者的混合信息的替代公式称为最小功率无失真响应(MPDR)和线性约束最小功率(LCMP)方法。
尽管上述方法能够在已知信号参数的情况下提供最佳解决方案,但仅从信号估计参数依然具有挑战性。业内存在几种空间滤波器参数估计方法,但它们通常假设语音源信号,并通常考虑是否已经发生语音的时间活动和概率。它们通常分类为语音活动检测器或流行的单通道语音存在概率(SPP)。
......(全文 1866 字,剩余 1381 字)
请微信扫码通过小程序阅读完整文章或者登入网站阅读完整文章
映维网会员可直接登入网站阅读
PICO员工可联系映维网免费获取权限