微软研究院团队研究不同Avatar渲染风格对虚拟协作的影响
当前阶段的真实Avatar虽然能够增强身份认同感与初期存在感,但其有限的非语言表达能力容易导致用户期望与现实之间的落差。相比之下,卡通Avatar虽然初印象不如真实Avatar强烈,但随时间推移更易被接受,且在情绪传达上的误差更小。
(映维网Nweon 2025年10月09日)由微软研究院、奥格斯堡大学和伦敦大学金史密斯学院组成的团队日前发布了一项研究成果,他们通过为期2-3周的实地实验揭示了不同Avatar渲染风格在沟通效能、任务满意度、存在感和情绪感知方面存在显著差异,而这可以为未来虚拟协作系统的设计提供重要依据。
研究团队设计了一项具有高生态效度的纵向实验,招募了6组共14名来自同一科技公司的员工。其中,参与者在日常工作中彼此熟悉且定期举行会议。实验使用HoloLens 2设备,每位参与者配备个性化的全身Avatar,其面部采用两种不同的渲染风格:真实面部基于参与者肩部以上照片通过Avatar SDK v2.0.5生成,追求高度逼真效果;卡通面部则使用同一照片通过Avatar SDK v1.2.4生成,采用风格化渲染技术。
在技术实现方面,所有Avatar共享相同的骨骼结构和命名约定,并通过逆向动力学实时驱动,能够准确反映用户的头部姿态、手部动作和位置移动。Avatar系统配备了基于语音振幅的唇部同步动画和周期性眨眼功能,但值得注意的是,由于时间限制,系统未实现精细的面部表情追踪、视线追踪或坐姿动画,这意味着参与者在整个会议过程中需保持站立状态。
研究采用组内交叉设计,半数小组先使用真实Avatar后切换为卡通风格(RC条件),另一半采用相反顺序(CR条件)。在54场会议中,研究人员收集了124份详细的问卷数据,涵盖了功能沟通价值、任务满意度、存在感、自我报告情绪和情绪感知准确性等多个维度。
在沟通功能方面,研究显示参与者普遍认为真实Avatar的非语言行为更加适宜于工作场景(p=0.019),且更有助于理解同事的意图(p=0.036)。然而,这种优势伴随着更高的期望值,当真实Avatar未能满足这些期望时,参与者表现出更大的失望感。一位参与者在反馈中写道:“整体上我对Avatar与真人的相似度印象深刻”,这是在首次使用真实Avatar后的评价;而到了最后一场使用真实Avatar的会议,同一位参与者则评论道:“语音部分还可以,但Avatar无法匹配我同事的表情。能够与他们面对面工作时,我可以轻易察觉问题所在。”
在情绪感知方面,研究发现了令人惊讶的结果:尽管真实Avatar在沟通功能上获得更高评价,但使用卡通Avatar时,参与者对同事情绪的感知误差显著更低(p=0.036)。这种差异在负面情绪(如“恼怒”和“压力”)的感知上尤为明显。在RC组中,参与者对“恼怒”和“压力”情绪的感知误差随时间显著上升(p=0.022;p=0.029)。进一步分析显示,当参与者自我报告高度“恼怒”时,同事对其情绪的感知误差显著增加,这一现象在卡通和真实Avatar条件下均存在,但在真实Avatar条件下更为突出。
关于线索利用方式,研究发现参与者普遍将“措辞”、“语音语调”和“动作/手势”评为最有用的情绪判断线索。有趣的是,在RC组中,“视线”被认为比“面部表情”更有用;而在CR组中,这两者均被评为最不重要的线索。这种差异可能与参与者对不同Avatar风格的期望有关:真实Avatar激发了参与者对非语言线索(如视线)的更高期待,尽管技术上并未实现真正的视线追踪。
研究的一个关键发现是时间因素对Avatar接受度的显著影响。使用卡通Avatar的参与者随时间推移表现出更好的同事识别能力(p=0.04),且对Avatar外观的关注度逐渐下降(p=0.01)。在CR组中,参与者在第一周使用卡通Avatar后,舒适度显著提升(p=0.05),且Avatar外观对其体验的影响逐渐减弱。
相比之下,真实Avatar的使用体验呈现出不同的时间轨迹。在RC组中,参与者在第一周使用真实Avatar时,对乐观和恼怒情绪的感知误差随时间增加(p=0.05;p=0.02),而在第二周切换到卡通Avatar后,对恼怒和专注情绪的感知误差则随时间减少(p=0.01;p<0.001)。这表明使用顺序对Avatar效果的调节作用不可忽视。
研究团队指出,当前阶段的真实Avatar虽然能够增强身份认同感与初期存在感,但其有限的非语言表达能力容易导致用户期望与现实之间的落差。相比之下,卡通Avatar虽然初印象不如真实Avatar强烈,但随时间推移更易被接受,且在情绪传达上的误差更小。
研究强调了语音质量在虚拟会议中的核心地位。在视觉渲染技术尚未完善的当下,优化空间音频与语音清晰度可能比追求极致的视觉真实感更具实际价值。另外,Avatar设计应更加注重其在具体使用场景中的功能价值,而非单纯追求外观的逼真度。
当然,研究团队指出了研究的若干局限性,包括样本量相对较小,参与者均来自科技公司可能导致的技术接受度偏差,以及Avatar系统中缺乏精细的面部表情与视线追踪功能。展望未来,研究将在更大样本、更复杂的交互场景中进一步验证相关发现,并探索更先进的表情与视线追踪技术对虚拟协作体验的影响。
总的来说,这项开创性的工作为混合现实协作系统的设计提供了实证基础,指明了在Avatar开发中需要平衡视觉真实性与功能实用性的重要方向,同时为未来企业在部署虚拟会议系统时的技术选型提供了科学依据。