多机构联合发布空间视频数据集SVD支持立体视频研究

编辑：刘余欣 | 分类：论文 | 2025年10月16日

加入映维网会员

空间视频数据集

（映维网Nweon 2025年10月16日）立体视频因其能够通过虚拟现实和增强现实等多种应用提供沉浸式三维内容，长期以来一直是研究的重点。其双视角格式固有的双目视差线索可增强深度感知与真实感。但直至近期，用于采集、编码与观看高质量立体视频的端到端流程既未广泛普及，同时未曾针对消费级设备优化。如今，Apple Vision Pro等现代头戴式显示器已内置支持立体视频采集、硬件加速编码、以及在Apple Vision Pro和Meta Quest 3等设备的无缝播放，用户操作极为简便。苹果将这一高效工作流称为”空间视频”。全民可用的完整立体视频流程催生了新的应用场景。尽管技术进步显著，目前依然缺乏包含完整空间视频流程的公开数据集。

在一项研究中，奥地利克拉根福大学，美国东北大学，英国卡迪夫大学和北京智源人工智能研究院团队提出空间视频数据集SVD，包含300段5秒视频序列（其中iPhone Pro与AVP各拍摄150段），以及10段时长至少2分钟的长视频。SVD数据集以开放许可协议公开发布，旨在促进编解码器性能评估、主客观体验质量评估、基于深度的计算机视觉、立体视频流传输以及神经渲染和体积捕捉等新兴三维应用的研究。

多机构联合发布空间视频数据集SVD支持立体视频研究