Meta提出基于智能眼镜的双耳房间脉冲响应盲识
基于智能眼镜的双耳房间脉冲响应盲识
(映维网Nweon 2024年10月17日)业界越发认为智能眼镜是增强现实的关键媒介。它提供了一个带集成麦克风和非耳塞扬声器的免手操作平台,可以将虚拟声源无缝地混合到现实世界的声学场景中。
为了令人信服地整合虚拟声源,虚拟声源的室内声学渲染必须与真实声学相匹配。然而,有关用户声学环境的信息通常不可用。
在研究中,Meta和瑞典查尔姆斯理工大学提出了基于智能眼镜的双耳房间脉冲响应盲识。他们使用一副智能眼镜中的麦克风阵列来从现实环境中的几秒钟语音中盲识双耳房间脉冲响应。所提出方法使用去噪和波束形成来产生一个伪参考信号。其中,伪参考信号由多通道维纳滤波器用来估计房间脉冲响应,然后将其转换为双耳房间脉冲响应。
多通道房间脉冲响应可用于估计房间声学参数,而在估计混响时间和直接-混响能量比方面优于基线算法。听力实验的结果进一步表明,与其他几何形状相似的房间相比,团队提出的方法通常更能令人信服地再现真实房间的声学效果。

用于AR的音频旨在通过虚拟声源来增强现实世界,从而真实地融入声学场景。作为系统的一环,虚拟声源的房间声学渲染必须与用户所在房间的声学相匹配。AR应用通常由头戴式设备或智能眼镜实现。
在研究中,Meta和瑞典查尔姆斯理工大学的研究人员提出了一种在现实声学条件下解决声学匹配问题的方法,并使用了集成到一副智能眼镜中的麦克风阵列来估计嘈杂现实环境中的双耳房间脉冲响应BRIR。
......(全文 1538 字,剩余 972 字)


