多机构联合发布空间视频数据集SVD支持立体视频研究
空间视频数据集
(映维网Nweon 2025年10月16日)立体视频因其能够通过虚拟现实和增强现实等多种应用提供沉浸式三维内容,长期以来一直是研究的重点。其双视角格式固有的双目视差线索可增强深度感知与真实感。但直至近期,用于采集、编码与观看高质量立体视频的端到端流程既未广泛普及,同时未曾针对消费级设备优化。如今,Apple Vision Pro等现代头戴式显示器已内置支持立体视频采集、硬件加速编码、以及在Apple Vision Pro和Meta Quest 3等设备的无缝播放,用户操作极为简便。苹果将这一高效工作流称为”空间视频”。全民可用的完整立体视频流程催生了新的应用场景。尽管技术进步显著,目前依然缺乏包含完整空间视频流程的公开数据集。
在一项研究中,奥地利克拉根福大学,美国东北大学,英国卡迪夫大学和北京智源人工智能研究院团队提出空间视频数据集SVD,包含300段5秒视频序列(其中iPhone Pro与AVP各拍摄150段),以及10段时长至少2分钟的长视频。SVD数据集以开放许可协议公开发布,旨在促进编解码器性能评估、主客观体验质量评估、基于深度的计算机视觉、立体视频流传输以及神经渲染和体积捕捉等新兴三维应用的研究。

沉浸式媒体技术通过呈现更真实且视觉冲击力更强的场景,正在重新定义数字内容的体验方式。虚拟现实、增强现实和混合现实的发展推动了高分辨率头戴显示器、空间音频集成及改进的立体渲染技术的进步。这种技术在娱乐、教育和视觉传达等领域实现了高度沉浸的体验,其中真实感和强烈临场感至关重要。
......(全文 2314 字,剩余 1759 字)
请微信扫码通过小程序阅读完整文章或者登入网站阅读完整文章
映维网会员可直接登入网站阅读
PICO员工可联系映维网免费获取权限


