雨果巴拉:行业北极星Vision Pro过度设计不适合市场

Facebook研究用于优化双耳渲染的空间分解函数

查看引用/信息源请点击:映维网

用于优化双耳渲染的空间分解函数

映维网 2021年05月14日Facebook官网日前收录了由科隆工业大学和Facebook Reality Labs组成的团队所发布的两份论文。两者主题相同,都描述了双耳渲染空间分解函数的优化,只是在不同场合发布。名为《Optimizations of the Spatial Decomposition Method for Binaural Reproduction》的论文在今年1月公布,面向《The Journal of the Audio Engineering Society(音频工程学会期刊)》,名为《Optimizing the Spatial Decomposition Method for Binaural Rendering》的论文则于2月公布,面向EAA/SFA e-Forum Acusticum (e-FA)。

空间分解函数(spatial decomposition method,SDM)是通过为房间脉冲响应(room impulse responses,RIR)的每个样本分配到达方向(direction of arrival;DOA)来将声场参数化为一系列平面波。所以,它可以通过根据测量的多通道房间脉冲响应的声场进行分析和再现。最初,这一函数是为开放式麦克风阵列使用而开发,利用麦克风之间的到达时间差(TDOA)来生成DOA估计。在论文中,团队将pseudointensity vector阵列的仿真和测量结果与TDOA的结果进行了比较,并研究了利用时差和开放阵列进行分析的最佳参数。

使用密集头相关传递函数(HRTF)数据集绘制SDM数据可实现高空间分辨率。然而,团队发现这可能导致严重的timbral degradations。随着RIR进入后期混响和多次反射重叠,DOA估计变得不稳定,可靠性会越来越差。反过来,RIR的连续样本映射到不同的位置,破坏窄带信息,从而增加宽带能量。当使用空间密集的HRTFs时,这种影响会更加突出,因为DOA估计的小波动会导致样本映射到几个相邻HRTF方向的错误。论文研究了正则量化网格在早期反射和后期混响的DOA估计中的应用。

当直接渲染用SDM分析的RIR时,快速变化的DOA估计的另一个结果是后期混响的白化,Tervo等人通过提出时频均衡来进一步解决这个问题。这种均衡最适合于扬声器再现,因为所得到的时变滤波器是通过将渲染的扬声器流与原始全向RIR进行比较而生成。当使用空间密集的HRTF数据集进行双耳渲染时,由于计算限制,这种方法变得不切实际,因为在使用虚拟扬声器方法进行双耳化之前需要渲染大量中间扬声器流。在这篇论文中,团队提出了一种替代均衡,包括混响校正过程(RTMod)和处理产生的双耳室内脉冲响应(BRIR)与级联全通滤波器(RTMod+AP)。

相关论文Optimizing of the Spatial Decomposition Method for Binaural Rendering

相关论文Optimizing the Spatial Decomposition Method for Binaural Rendering

在感知实验中,研究人员通过直接比较双耳信号和真实扬声器来研究双耳SDM渲染所需的最小空间分辨率。初步结果表明,双耳房间脉冲响应的听觉效果与真实扬声器一样可信。

本文链接https://news.nweon.com/85707
转载须知:转载摘编需注明来源映维网并保留本文链接
素材版权:除额外说明,文章所用图片、视频均来自文章关联个人、企业实体等提供
QQ交流群苹果Vision  |  Meta Quest  |  微软HoloLens  |  AR/VR开发者  |  映维粉丝读者

您可能还喜欢...

资讯