ETH Zurich提出ConBO算法实现VR/AR交互自动优化

查看引用/信息源请点击:映维网Nweon

利用以前用户的数据来加速优化,在适应个人特征的同时利用共享特征

映维网Nweon 2025年06月24日)由于用户的运动能力、偏好和行为不同,虚拟现实和增强现实中的输入交互最佳设置在个体之间差异很大。今天的交互系统要么通常忽略这种可变性,要么依赖于手动用户调整和明确的校准程序,这可能导致交互效率低下或增加设置时间。

尽管Human-in-the-Loop优化有可能在使用过程中确定最佳设置,但由于其优化过程较长,所以很少应用。更有效的方法是不断利用以前用户的数据来加速优化,在适应个人特征的同时利用共享特征。

Human-in-the-Loop(人机协同/人在回路) 是一种将人类智能与人工智能系统紧密结合的方法论。其核心思想是:在AI系统的关键环节引入人类的判断、决策或反馈,形成一个“人机协作闭环”,从而提升系统的准确性、可靠性和适应性。

在一项研究中,苏黎世联邦理工学院团队介绍了Continual Human-in-the-Loop Optimization和基于贝叶斯优化的方法,利用贝叶斯神经网络代理模型来捕获种群水平特征,同时适应新用户。他们提出了一种生成式重放策略来减轻灾难性遗忘,随着用户基数的增加,适应时间可以缩短。

由于用户的运动能力、偏好和行为不同,虚拟现实和增强现实中的输入交互最佳设置在个体之间差异很大。今天的交互系统要么通常忽略这种可变性,要么依赖于手动用户调整和明确的校准程序,这可能导致交互效率低下或增加设置时间。

人在回路优化(HiLO)提出了一种替代方法,基于用户过去的特定设计参数的性能来优化交互。HiLO已在广泛的应用中证明其有效性,包括目标选择、文本输入和视觉设计等。

尽管计算优化器有助于避免对每个设计选项进行详尽的测试,并旨在以最少的用户试验确定最佳解决方案,从而减少用户花在次优设置的时间,但HiLO广泛采用的一个重要障碍是其相对较低的样本效率。在没有先验信息的情况下,HiLO通常依赖于初始随机搜索来探索问题空间,需要大量的试验来收敛到最优解。

另外,每个用户都必须从头开始优化过程。例如,优化3D选择的传递函数可能需要每个用户花费60到90分钟。尽管单个用户在不同的输入设置下可能有不同的偏好和性能,但可以利用用户群中的共享特征来提高用户之间的优化器效率。

理想情况下,随着来自先前用户的数据的积累,优化将变得更加高效,允许后续用户从先前的优化经验中受益,同时保持足够的灵活性,以确保发现适合个人需求的最佳解决方案。

所以在一项研究中,苏黎世联邦理工学院团队研究了这样一个问题:优化器能否不断地从先前的用户体验中学习,从而随着时间的推移提高效率?

尽管有潜力,但目前的计算方法并不支持对HiLO进行不断改进的优化。另外在现有的研究文献中,问题本身和相应的挑战并没有得到彻底的阐述。一个相关的概念是元贝叶斯优化,它结合了元学习和贝叶斯优化。有的研究演示了在线HiLO中使用元贝叶斯优化,其中一批“优先用户”需要从头开始经历一个完整的优化过程,使优化器能够更有效地处理后续“最终用户”。

然而,这种方法有一个关键的限制:部署期间的计算时间随着先前用户的数量增加而增加,从而导致可扩展性问题。超过某一点,它就变得不切实际,因为用户在适应过程中会遇到严重的延迟。另外,所述方法假设“优先用户”可以投入足够的时间来进行彻底的优化,但这在实践中可能不可行。换句话说,所述方法不适合直接转换为持续学习框架。

另一个密切相关的概念是持续学习,其中模型通过在不同任务之间积累知识来提高其预测能力(在HiLO上下文中,任务是针对特定用户进行优化)。最近眼镜出现了关于优化背景下持续学习的研究,但它们的目标问题仅限于线性离散问题,其中典型的HiLO处理与连续和多维参数空间的相互作用。HiLO面临的独特挑战和相应的持续学习方法未得到解决和探索。

为了填补研究空白,团队提出了持续人在回路优化(CHiLO)的问题和概念。这种计算优化器,能够通过利用以前用户积累的经验不断提高效率和性能(如图所示)。

团队进一步确定了与持续学习相一致的关键技术挑战,包括可扩展性、灾难性遗忘、稳定性-可塑性困境,以及由于观测数据分布不均匀而导致的模型不稳定性。相关挑战指导了构建CHiLO方法的设计原则。

最后,团队提出了一种新的方法——种群信息连续贝叶斯优化(ConBO)。ConBO的核心是一个贝叶斯神经网络(BNN),它的训练数据是由以前用户的单个模型合成,每个模型都代表一组独特的用户特征。所述方法通过逐步将种群水平的用户体验与每个新用户集成,以促进更稳定和健壮的持续优化。

研究人员使用一系列标准基准优化函数验证了ConBO的有效性和泛化性,并证明了ConBO可以随着用户数据的积累而提高优化效率。最后,他们应用ConBO来优化VR中使用文本输入的悬空键盘配置。评估显示,与针对每个用户从头开始优化相比,随着用户数量的增加,用户性能和收敛时间都有了显著改善。

相关论文Continual Human-in-the-Loop Optimization
https://arxiv.org/pdf/2503.05405

总的来说,团队解决了人在回路优化中的一个新挑战:优化器如何不断积累经验并随着时间的推移而改进?团队提出了ConBO。这种基于贝叶斯神经网络的方法通过种群模型捕获种群级用户特征,并使用以前用户的存储模型结合生成记忆重播机制。ConBO在VR悬空文本输入方面的评估表明,在适应效率和整体性能方面,它比标准贝叶斯优化有了显著改善,同时在不需要明确用户反馈的情况下提供与手动调整相当的性能。

随着时间的推移,结果进一步显示出明显的改进趋势,后来的用户组从系统积累的知识中受益。这说明了ConBO在向以前的用户学习的过程中逐步提高适应效率的能力。

团队表示,随着系统在用户、设备和任务之间的改进,ConBO可以成为未来真正自适应和个性化交互的关键推动者,并最终演变为为广泛的应用实现高效和无摩擦的交互。

本文链接https://news.nweon.com/130547
转载须知:转载摘编需注明来源映维网并保留本文链接
素材版权:除额外说明,文章所用图片、视频均来自文章关联个人、企业实体等提供
QQ交流群苹果Vision  |  Meta Quest  |  微软HoloLens  |  AR/VR开发者  |  映维粉丝读者
资讯