谷歌研发AR环境声音可视化技术辅助听障人士

查看引用/信息源请点击:映维网Nweon

提高对环境声音的定向感知能力增强

映维网Nweon 2025年08月04日)AR是一种将虚拟内容叠加到用户真实世界视图的技术,从而提供复合视图。AR设备可以将语音转换为文本,并将书面转录内容呈现在显示器的预定区域。这样的技术对于听力受损用户十分有用。

在一份专利申请中,谷歌就介绍了一种相关技术。具体来说,发明描述了一种根据捕获音频数据生成环境声音的情景信息的方法,目标是提高对环境声音的定向感知能力增强。

在一个实施例中,专利描述的方法包括,从由显示设备上的多个麦克风捕获的音频数据中检测环境声音;基于所述音频数据,确定所述环境声音的声源位置;基于包含所述环境声音的所述音频数据的音频段,生成关于所述环境声音的情境信息;以及由所述显示设备基于所述声源位置显示所述情境信息。

另外,可以基于所述音频数据,确定所述环境声音的第一声源的第一位置和所述语音的第二声源的第二位置;基于包含所述环境声音的所述音频数据的第一音频段,生成关于所述环境声音的第一情境信息;基于音频数据的第二音频段,生成关于所述语音的第二情境信息;由所述显示设备基于所述第一声源的所述第一位置显示所述第一情境信息;以及由所述显示设备基于所述第二声源的所述第二位置显示所述第二情境信息。

......(全文 3267 字,剩余 2775 字)


请微信扫码通过小程序阅读完整文章
或者登入网站阅读完整文章
映维网会员可直接登入网站阅读
PICO员工可联系映维网免费获取权限

本文链接https://news.nweon.com/131448
转载须知:转载摘编需注明来源映维网并保留本文链接
素材版权:除额外说明,文章所用图片、视频均来自文章关联个人、企业实体等提供
QQ交流群苹果Vision  |  Meta Quest  |  AR/VR开发者  |  映维粉丝读者

您可能还喜欢...

资讯