西交大提出DynamicAvatars框架:高斯飞溅+LLM驱动VR虚拟人实时定制
DynamicAvatars
(映维网Nweon 2025年05月12日)动态Avatar的生成和编辑是虚拟现实等领域中的关键任务。然而,现有的方法经常遭受面部扭曲,头部运动不准确和有限的细粒度编辑能力的影响。为了解决所述挑战,西安交通大学团队提出了DynamicAvatars。
这个动态模型可以从视频剪辑和与面部位置和表情相关的参数中生成逼真的移动3D Avatar。所述方法通过一种基于提示的编辑模型实现精确的编辑,将用户提供的提示与来自大型语言模型的指导参数集成在一起。
为了实现这一目标,研究人员提出了一个基于高斯飞溅的双追踪框架,并引入了一个快速预处理模块来提高编辑稳定性。通过结合专门的GAN算法并将其连接到我们的控制模块,可以从大型语言模型生成精确的指导参数。另外,他们开发了一种动态编辑策略,选择性地利用特定的训练数据集来提高效率。

由于计算机视觉在AR/VR等领域中的重要性,创建和编辑Avatar的已成为一个重要研究方向。高效地生产和灵活地编辑详细的人体模型对于相关应用至关重要。传统的方法利用显式3D表示,如点云和网格,但往往难以准确地捕捉精细的几何细节。
人脸固有的复杂性,其复杂的纹理、不可预测的姿势和动态的表情,进一步复杂化了识别和建模潜在模式的任务。隐式3D表示方法解决了许多这些挑战,提供了重建逼真的人类化身的能力。
通过引入新颖的渲染管道和基于神经网络的色彩存储技术,神经辐射场NeRF取得了显著的成功。它们能够生成高度复杂的场景,并显著降低了时空计算成本。另外,相关方法在重建动态场景和渲染新颖视图方面同样取得了令人印象深刻的成果。
......(全文 1738 字,剩余 1152 字)


