雨果·巴拉:行业北极星Vision Pro过度设计不适合产品市场

萨里大学与阿尔托大学改进房间声学模型,优化XR沉浸式听觉体验

查看引用/信息源请点击:映维网Nweon

带来基线模型的显著改进

映维网Nweon 2025年03月19日)室内声学合成可用于XR并增强听者的沉浸感。一种常用的方法是使用几何声学(GA)模型以交互速度计算脉冲响应,并使用快速卷积方法实时应用响应。另外,基于延迟网络的模型能够模拟房间声学的特定方面,而计算成本明显较低。

为了弥合这两类模型之间的差距,业界已经引入了近似声学辐射传递(ART)的延迟网络设计。在一项研究中,英国萨里大学和芬兰阿尔托大学团队给出了这种设计的两个关键扩展。

第一个扩展涉及一个新的基于物理和保持稳定的反馈矩阵设计,以更精确地控制散射,亦即后期混响特性。

第二个扩展允许任意数量的早期反射以高精度建模,这意味着网络可以在计算成本和早期混响精度之间随意缩放。

评估结果表明,所提出的扩展可以带来基线模型的显著改进,特别是对于非凸几何形状或壁面吸收分布不均匀的情况。

房间声学建模领域涉及预测环境的声学行为。这在各种各样的领域都有应用。理想的模拟是实时执行。基于波的室内声学模型是基于控制声波传播的物理定律,所以可以解释所有的声学现象。

但这是以相当复杂的计算为代价,使得模型无法实时运行于宽带信号中。

几何声学(GA)模型将声音的传播近似为以射线为特征,而不是以波为特征。这种近似不能正确捕获诸如房间共振和模态行为等现象,这个问题可以通过考虑基于波/GA的混合模型来解决。与其他类型的模型类似,GA不能产生“真实”再现,因为同一场景的模拟和测量之间的差异清晰可闻的。

但至关重要的是,它们能够以一种足够可信的方式渲染声学,而这是渲染VR/AR时更为重要的标准。

即便是使用最快的GA算法模型,都只能在有限的计算资源下实时模拟有限数量的反射。表征环境感知混响时间的高反射阶数导致计算负载稳步增加。预测的房间脉冲响应(RIR)一般通过与上述两种模型类的卷积应用于源信号。这增加了计算需求——卷积的计算成本随着RIR的持续时间而增加——并可能引入不希望的延迟。

对信号施加混响的另一种方法是使用递归连接的延迟线。相关方法在计算方面比其他方法更有效,但本质上并不构成环境的物理模型。

业界已经提出了利用每种方法的优点的房间声学模型。它们由基于延迟的结构组成,同时在其设计中结合了GA组件,从而提供基于空间物理属性的快速建模。

然而,相关模型依然受到基于卷积的GA的特定限制。它们缺乏对散射系数的控制,而这是一个重要的声学参数。另外,它们只能产生可靠的一阶精确反射。

在一项研究中,英国萨里大学和芬兰阿尔托大学团队给出了这种设计的两个关键扩展。

另外,基于延迟网络的模型能够模拟房间声学的特定方面,而计算成本明显较低。

第一个扩展涉及一个新的基于物理和保持稳定的反馈矩阵设计,以更精确地控制散射,亦即后期混响特性。

第二个扩展允许任意数量的早期反射以高精度建模,这意味着网络可以在计算成本和早期混响精度之间随意缩放。

相关扩展有助于对具有非凸几何形状或不均匀分布的壁吸收的环境进行建模,而这是实际应用中经常需要的元素。

相关论文Room Acoustic Rendering Networks with Control of Scattering and Early Reflections

总的来说,团队探索了一种基于几何声学(GA)的房间声学模型,并提出了两个关键扩展。第一个包括物理信息反馈矩阵的设计,其能够明确控制墙壁材料的散射特性。第二个涉及高阶注入操作,可以自由缩放早期反射的数量,并精确建模,改善回波密度的积累。

评估表明,所提出的扩展在基线产生了显著的改进。这对于具有非凸几何形状或不均匀分布的墙壁吸收的房间尤其明显。

展望未来,团队将研究如何进一步利用ART矩阵的结构来减少近似误差。

本文链接https://news.nweon.com/128470
转载须知:转载摘编需注明来源映维网并保留本文链接
素材版权:除额外说明,文章所用图片、视频均来自文章关联个人、企业实体等提供
QQ交流群苹果Vision  |  Meta Quest  |  微软HoloLens  |  AR/VR开发者  |  映维粉丝读者
资讯