英伟达开发QUEEN大模型,可高效实现自由视点VR视频流媒体体验

PICO 4 Ultra

查看引用/信息源请点击:映维网Nweon

这种速度和视觉质量的结合可以通过提供沉浸式虚拟现实体验或比赛关键时刻的即时重播来支持音乐会和体育比赛的媒体广播

映维网Nweon 2024年12月10日英伟达和马里兰大学联合开发了一个名为QUEEN的人工智能模型,它可以高效实现自由视点视频流媒体,允许用户从任何角度体验3D场景。对于特定高度动态的场景,它将模型大小减少到每帧0.7 MB,而训练时间不到5秒,渲染速度约为350 FPS。

英伟达指出,这种速度和视觉质量的结合可以通过提供沉浸式虚拟现实体验或比赛关键时刻的即时重播来支持音乐会和体育比赛的媒体广播。

英伟达开发QUEEN大模型,可高效实现自由视点VR视频流媒体体验

英伟达研究主管沙利尼·德梅洛(Shalini De Mello)表示:“为了近乎实时地传输自由视点视频,我们必须同时重建和压缩3D场景。QUEEN平衡了压缩率、视觉质量、编码时间和渲染时间等因素,创造了一个优化的管道,为视觉质量和流媒体性设定了新的标准。”

之前用于生成自由视点视频的人工智能方法要么占用太多内存,要么牺牲视觉质量。QUEEN平衡了这两者,而且能够比先前方法更快地渲染视觉效果,支持流媒体用例。

在大多数现实环境中,场景的大多数元素保持静态。在视频中,这意味着大部分像素不会从一帧到另一帧发生变化。为了节省计算时间,QUEEN会专注于重建随时间变化的内容,重用静态区域的渲染。

根据团队介绍,QUEEN可以用来构建沉浸式流媒体应用,教授烹饪等技能,允许体育迷从球场中的任何角度欣赏精彩比赛,以及用于工业环境,帮助远程操作仓库等等。

......(全文 966 字,剩余 429 字)

wx_mp

请微信扫码通过小程序阅读完整文章或者登入网站阅读完整文章
映维网会员可直接登入网站阅读
PICO员工可联系映维网免费获取权限

本文链接https://news.nweon.com/126318
转载须知:转载摘编需注明来源映维网并保留本文链接
素材版权:除额外说明,文章所用图片、视频均来自文章关联个人、企业实体等提供
QQ交流群苹果Vision  |  Meta Quest  |  AR/VR开发者  |  映维粉丝读者
XR Research Wechat Group/微信群

您可能还喜欢...

资讯