中科大与Hidream团队提出文本驱动的零样本立体视频生成系统T-SVG

编辑：刘余欣 | 分类：论文 | 2025年5月5日

加入映维网会员

查看引用/信息源请点击：映维网Nweon

文生立体视频

（映维网Nweon 2025年05月05日）立体视频的出现开辟了多媒体的新视野，特别是在XR应用中。尽管XR越来越受欢迎，但由于产生立体视差所涉及的技术复杂性，制作立体视频依然具有挑战性。

为了解决相关问题，中国科学技术大学和Hidream团队介绍了文本驱动的立体视频生成系统T-SVG。这种创新的、跨模型的、zero shot的方法通过使用文本提示来创建参考视频，从而简化了视频生成。

团队指出，视频转换成三维点云序列，从两个视差细微的角度进行渲染，从而达到自然的立体效果。T-SVG通过在文本到视频的生成、深度估计和视频绘制中集成最先进的、无需训练的技术，代表了立体内容创建方面的重大进步。

其灵活的架构确保了高效率和用户友好性，无需重新训练即可无缝更新模型。通过简化生产流程，T-SVG使更广泛的受众能够访问立体视频生成，展示了其在XR领域的革命性潜力。

......（全文 1323 字，剩余 990 字）

请微信扫码通过小程序阅读完整文章
或者登入网站阅读完整文章
映维网会员可直接登入网站阅读
PICO员工可联系映维网免费获取权限

您可能还喜欢...