英伟达开发QUEEN大模型,可高效实现自由视点VR视频流媒体体验
这种速度和视觉质量的结合可以通过提供沉浸式虚拟现实体验或比赛关键时刻的即时重播来支持音乐会和体育比赛的媒体广播
(映维网Nweon 2024年12月10日)英伟达和马里兰大学联合开发了一个名为QUEEN的人工智能模型,它可以高效实现自由视点视频流媒体,允许用户从任何角度体验3D场景。对于特定高度动态的场景,它将模型大小减少到每帧0.7 MB,而训练时间不到5秒,渲染速度约为350 FPS。
英伟达指出,这种速度和视觉质量的结合可以通过提供沉浸式虚拟现实体验或比赛关键时刻的即时重播来支持音乐会和体育比赛的媒体广播。

英伟达研究主管沙利尼·德梅洛(Shalini De Mello)表示:“为了近乎实时地传输自由视点视频,我们必须同时重建和压缩3D场景。QUEEN平衡了压缩率、视觉质量、编码时间和渲染时间等因素,创造了一个优化的管道,为视觉质量和流媒体性设定了新的标准。”
之前用于生成自由视点视频的人工智能方法要么占用太多内存,要么牺牲视觉质量。QUEEN平衡了这两者,而且能够比先前方法更快地渲染视觉效果,支持流媒体用例。
在大多数现实环境中,场景的大多数元素保持静态。在视频中,这意味着大部分像素不会从一帧到另一帧发生变化。为了节省计算时间,QUEEN会专注于重建随时间变化的内容,重用静态区域的渲染。
根据团队介绍,QUEEN可以用来构建沉浸式流媒体应用,教授烹饪等技能,允许体育迷从球场中的任何角度欣赏精彩比赛,以及用于工业环境,帮助远程操作仓库等等。
......(全文 966 字,剩余 429 字)


