Facebook发布AR/VR研究项目Ego4D，训练AI以第一人称理解感知世界

编辑：刘余欣 | 分类：论文 | 2021年10月20日

加入映维网会员

能够从第一人称角度理解世界的人工智能可以开启沉浸式体验的新时代

（映维网 2021年10月20日）随着AR眼镜和VR头显逐渐成为智能手机这样的普及设备，能够从第一人称角度理解世界的人工智能可以开启沉浸式体验的新时代。想象一下，你的AR设备能够在架子鼓课堂中准确显示如何握拿鼓槌，指导你根据食谱烹饪菜肴，帮助你找到丢失的钥匙，或者通过面前的全息图帮助你回忆过去……

为了构建所述新技术，我们需要教导AI如同人类一样从第一人称角度理解世界并与其交互，亦即研究业界所说的自我中心认知。然而，今天的计算机视觉系统通常是利用数百万张以第三人称视角拍摄的照片和视频进行学习。Facebook首席研究科学家克里斯汀·格劳曼 (Kristen Grauman) 表示：“下一代人工智能系统需要从一种完全不同的数据中学习：一种从事件中心视觉而不是边线视觉展示世界的视频。”

所以，Facebook AI日前发布了一个旨在解决自我为中心认知挑战的长期研究项目：Ego4D。团队组建了一个由9个国家的13所大学和实验室组成的联盟，并收集了2200多小时的第一人称视频，其中有700多名参与者讲述了自己的日常生活。这极大地增加了当前研究社区公开的自我中心认知数据规模，而且要比任何其他数据集多20倍（以小时为单位）。当然，为了资助项目，Facebook向每一所参与的大学赠送了学术礼品。

Facebook AI同时与所述联盟和Facebook Reality Labs Research（FRL Research）合作，开发了五个围绕第一人称视觉体验视觉体验的基准挑战。Ego4D的五个基准是：

......（全文 3567 字，剩余 3032 字）

请微信扫码通过小程序阅读完整文章
或者登入网站阅读完整文章
映维网会员可直接登入网站阅读
PICO员工可联系映维网免费获取权限