圣三一大学研究团队评估3D高斯人群渲染感知质量
为改进基于高斯的人群渲染系统提供了坚实的基础,对需要可扩展和逼真可视化的实时应用具有实际意义
(映维网Nweon 2025年05月28日)高效逼真的人群渲染是虚拟现实等实时图形应用的重要组成。业界正在探索3DGS在实时人群渲染方面的潜力。在一项研究中,爱尔兰都柏林圣三一大学团队提出了一个2AFC实验,并旨在确定3D高斯Avatar的感知质量。
研究人员探索了三个因素:运动、LOD和Avatar高度。其中,被试将查看成对的动画3D高斯Avatar,并选择最详细的一个。团队指出,相关研究结果可以为基高斯人群渲染中的LOD策略优化提供信息支持,从而帮助在实时应用中实现高效渲染的同时保持视觉质量。
多年来,逼真人群场景模拟一直是一个活跃的研究领域。在这项研究中,爱尔兰都柏林圣三一大学团队专注于人群渲染的3DGS问题,并评估了多个因素是如何影响用户感知高斯人群。
高斯Avatar的自适应LOD策略在平衡计算成本和视觉保真度方面显示出了希望,特别是在虚拟环境中。然而,尽管先前已经研究了LOD人类表征的感知,但使用基于真实图像的高斯Avatar进行人群渲染的感知影响尚未得到充分探索。
针对这个问题,团队提出了一个用户研究,目标是回答以下关于高斯Avatar的问题:
Q1:比起复杂的周期性运动,简单的周期性运动是否更容易引起伪影?
Q2:减少LOD(即高斯数)是否会提高伪影的可见性?
Q3:如果增加距离),伪影是否不那么明显?
Q4:伪影的可见性是否会因运动、LOD和像素的不同组合而有所不同?
在一个2AFC实验中,团队研究了运动、LOD和像素及其相互作用对高斯Avatar感知的影响。其中,被试将查看成对的动画3D高斯Avatar,其中一个以最高质量(黄金标准)渲染,而另一个以较低的LOD渲染。
一组被试查看Avatar的周期性慢跑动作,而另一组查看复杂的武术表演。对于两者,任务都是选择显示的两个Avatar中最详细的一个。以运动(2)× LOD (3) ×像素(5)和准确度(即正确选择金标准的次数比例)为自变量进行三向方差分析(ANOVA),然后进行Bonferroni事后检验。
更高的精度表明视觉伪影更明显。团队发现,对于Q1,答案是否定的。运动是主要的影响因素,复杂运动比周期性运动的精度更高,表明前者的伪影更明显。
对于Q2,答案是肯定的,因为准确性(以及随之而来的伪影检测)随着高斯函数数量的增加而下降。
第三个问题的答案是“不总是”,因为没有发现像素的主要影响。但要回答第4个问题,像素确实与LOD相互作用,当Avatar以最低LOD和最低像素数(即在最远的距离)呈现时最为准确。没有发现其他显著的相互作用效应。
团队指出,这一结果可用于指导在实时动画人群场景中放置高斯人群。获得的见解可以帮助优化LOD策略并实现高效渲染,同时在实时应用程序中保持视觉质量。
另外,结果证明了3DGS方法在实现计算效率而不牺牲视觉保真度方面的潜力。然而,特定限制为未来的探索提供了机会。3DGS使用多视图图像作为输入来重建场景。3D高斯图像的不透明度α在0和1之间优化。然而,高斯Avatar将不透明度固定在α = 1,以保持所有3D高斯可见,迫使网络预测准确的3D高斯位置。
当多个不透明的3D高斯投影到单个像素时,由于距离较远的3D高斯叠加,可能会出现伪影。被试会注意到,手周围的白点、虚线或衣服的文字等意想不到的视觉人工伪影会影响他们的判断,并可能会给结果带来偏见。在未来的实验中处理相关伪影将有助于消除混淆因素。
另外,未来的研究需要对查看条件进行标准化,以确保被试的一致性。另外,尽管研究考察了运动、3D高斯数和距离,但它没有考虑到其他感知因素,如照明条件或环境复杂性。所以,在未来的研究中纳入变量将增强所建议阈值的适用性和稳健性。
相关论文:Evaluating CrowdSplat: Perceived Level of Detail for Gaussian Crowds
总之,团队表示尽管存在限制,但结果为改进基于高斯的人群渲染系统提供了坚实的基础,对需要可扩展和逼真可视化的实时应用具有实际意义。