中科大与Hidream团队提出文本驱动的零样本立体视频生成系统T-SVG
文生立体视频
(映维网Nweon 2025年05月05日)立体视频的出现开辟了多媒体的新视野,特别是在XR应用中。尽管XR越来越受欢迎,但由于产生立体视差所涉及的技术复杂性,制作立体视频依然具有挑战性。
为了解决相关问题,中国科学技术大学和Hidream团队介绍了文本驱动的立体视频生成系统T-SVG。这种创新的、跨模型的、zero shot的方法通过使用文本提示来创建参考视频,从而简化了视频生成。
团队指出,视频转换成三维点云序列,从两个视差细微的角度进行渲染,从而达到自然的立体效果。T-SVG通过在文本到视频的生成、深度估计和视频绘制中集成最先进的、无需训练的技术,代表了立体内容创建方面的重大进步。
其灵活的架构确保了高效率和用户友好性,无需重新训练即可无缝更新模型。通过简化生产流程,T-SVG使更广泛的受众能够访问立体视频生成,展示了其在XR领域的革命性潜力。
......(全文 1323 字,剩余 990 字)
请微信扫码通过小程序阅读完整文章或者登入网站阅读完整文章
映维网会员可直接登入网站阅读
PICO员工可联系映维网免费获取权限