Meta推出Meta Motivo人工智能模型操控数字代理人动作
有望增强元宇宙体验
(映维网Nweon 2024年12月16日)Meta日前发布了一个名为Meta Motivo的人工智能模型。它可以控制一个类似人数字代理的动作,并有望增强元宇宙体验。
无监督强化学习涉及预训练模型,以解决复杂环境中的广泛下游任务。大多数方法需要高度管理的交互数据集,并且通常依赖于致使策略可能与目标任务不一致的无监督损失。
针对这个问题,Meta开发了可以控制虚拟人形代理动作以执行复杂任务的行为基础模型Meta Motivo。
Meta Motivo采用了一种新颖的算法来模仿来自未标记行为数据集的轨迹。算法的关键创新点在于学习一种可用于将状态、运动和奖励嵌入到相同的latent空间中的表征。所以,Meta Motivo能够解决广泛的全身控制任务,包括运动追踪、目标姿势达到和奖励优化,无需任何额外的训练或规划。
与特定任务方法相比,Meta Motivo实现了具有竞争力的性能,优于最先进的无监督强化学习和基于模型的基线,同时表现出更像人类的行为。模型对环境变化(如重力、风或直接扰动)同样显示出惊人的鲁棒性。
团队总结道:“我们相信这项研究未来可以为元宇宙中完全具身化的代理铺平道路,带来更逼真的NPC,以及新型的沉浸式体验。”