Facebook用竞技体育训练深度学习框架,为AR/VR探索复杂密集性交互
探讨了用于训练二人竞技体育的控制系统的技术
(映维网 2021年07月13日)大多数体育项目都需要长时间的竞赛,同时其间会穿插敏捷的技巧表现。例如在拳击和击剑等双人竞技运动中,运动员在比赛中经常表现出高效的战术动作。这种关键时刻往往决定着比赛的结果,而观众一直在等待并为其欢呼。
但是,这同样意味着复杂性,所以动画角色一般难以精确再现。如果能够创建可以自动执行竞技动作,并将它们组合成制胜策略,我们将在游戏、电影和体育广播中开辟众多新应用。创建多人动画场景是一个挑战,因为它不仅要求每个人以自然的方式行事,而且要求它们之间的交互在时间和空间域同步。
交互越密集,问题就越具有挑战性,因为没有时间在交互之间“重置”。使用物理模拟的角色简化了问题的一部分,因为底层物理交互(如碰撞)是通过模拟自动生成。然而,由于学习构成一场完整比赛的一系列技能的计算复杂性,如何协调不同技能尚未得到深入研究。在竞技体育中使用模拟角色的一个关键挑战是,我们需要学习基本技能和赛级别策略,以便它们能够协调一致地工作。近年来,深度强化学习技术在为运动和操纵等常见行为,以及骑自行车和体操等更复杂行为创建控制器或控制策略方面取得了长足的进步。不过,所述行为大多只涉及单个角色,需要角色间相互作用的行为尚没有得到深入的研究。
在名为《Control Strategies for Physically Simulated Characters Performing Two-player Competitive Sports》的论文中,Facebook AI Reasearch探讨了用于训练二人竞技体育的控制系统的技术,并开发了一个为具有多个自由度的模拟运动员生成控制策略的学习框架。团队提出的框架采用了两步学习法,用深度强度学习来学习基本技能和学习比赛级别策略,以及深度强化学习。

研究人员开发了一个基于编码器-解码器结构的策略模型,其包含一个自回归潜变量和一个Mixture-of-Experts(MOE)解码器。为了证明框架的有效性,Facebook AI Reasearch实现了两个竞技体育项目:拳击和击剑,并且展示了框架学习到的控制策略。团队同时通过与其他学习配置和消融研究的比较来评估控制策略。
......(全文 1870 字,剩余 1120 字)


