以色列与意大利研究团队开发基于扩散模型的声学响应重建技术

PICO 4 Ultra

查看引用/信息源请点击:映维网Nweon

即使在麦克风之间存在较大间隙的情况下,所提出方法都能成功重建缺失的RIRs

映维网Nweon 2025年08月15日)房间脉冲响应(RIRs)表征声学环境,并在多种音频信号处理任务中至关重要,包括AR/VR。高质量的RIR估计驱动着诸如虚拟麦克风、声源定位、增强现实和数据增强等应用。然而,获取具有高空间分辨率的RIR测量资源消耗巨大,对于大空间或需要密集采样的情况显得不切实际。

在一项研究中,以色列巴伊兰大学和意大利米兰理工大学团队希望解决使用去噪扩散概率模型(DDPM)估算房间内未测量位置RIRs的挑战。所提出方法利用了RIR矩阵与图像修复之间的类比,将RIR数据转换为适合基于扩散模型进行重建的格式。

利用基于镜像法模拟的RIR数据,团队在从线性到半圆形的不同曲率麦克风阵列上证明了所提出方法的有效性。即使在麦克风之间存在较大间隙的情况下,所提出方法都能成功重建缺失的RIRs。在此类条件下,该方法实现了精确的重建,在归一化均方误差(NMSE)以及实际RIR与插值RIR之间的余弦距离(CD)指标上显著优于基线三次样条插值法。

这项研究凸显了使用生成模型进行有效RIR插值的潜力,为从有限的真实世界测量数据中生成额外数据铺平了道路。

......(全文 2606 字,剩余 2158 字)


请微信扫码通过小程序阅读完整文章
或者登入网站阅读完整文章
映维网会员可直接登入网站阅读
PICO员工可联系映维网免费获取权限

本文链接https://news.nweon.com/131672
转载须知:转载摘编需注明来源映维网并保留本文链接
素材版权:除额外说明,文章所用图片、视频均来自文章关联个人、企业实体等提供
QQ交流群苹果Vision  |  Meta Quest  |  AR/VR开发者  |  映维粉丝读者
XR 招聘Job
XR Research Wechat Group/微信群
资讯