雨果巴拉:行业北极星Vision Pro过度设计不适合市场

苹果专利为 AR/VR虚拟世界推出内容分级系统,警示黄赌毒、暴力粗俗内容

查看引用/信息源请点击:映维网

由经过训练的神经网络根据目标受众提供不同的场景

Vision Pro QQ群交流653565822

映维网Nweon 2022年01月20日)若熟悉影视领域,你应该知道所谓的“观影分级制度”。这主要是指影视作品根据性爱、暴力、毒品、粗俗语言和反动等内容将其划分成特定级别,并给每一级规定好允许面对的受众群体。 在名为“Modifying existing content based on target audience”的专利申请中,苹果同样介绍了一种类似的内容分级系统,并且主要针对AR/VR领域。

具体来说,这家公司构思的系统能够根据目标受众调整现有的内容。 苹果指出,现代智能设备能够生成和呈现内容。然而,特定内容可能适合一个受众群体,但可能不适合另一个受众群体。例如,特定内容可能包括暴力内容或粗俗语言。

另外,为不同受众生成不同的XR内容对于设备的计算成本和储存成本而言十分昂贵。同时,要求内容创作者开发不同版本同样成本高昂。

行业采取的一种方式是模糊掩盖。例如对于粗俗语言,可以通过哔哔声之类的声音掩盖。对于暴力内容,可以以一系列不同的打码方式来进行模糊掩盖,甚至可以跳过。但这种方式会减损用户体验。

所以,苹果提出了一种根据目标受众来修改内容的解决方案。简单来说,这家公司希望将内容评级,然后由神经网络根据目标受众提供不同的场景。例如对于存在暴力的场景,可以由经过训练的神经网络生成不太暴力的场景,并将其提供给合适的受众,比方说将枪战换成简单的拳打脚踢。
在一个实施例中,可以从现有XR内容中提取一个或多个动作。然后,可以使用场景分析、场景理解、实例分割和/或语义分割的组合来提取一个或多个动作。

在一个实施例中,标识需要修改的一个或多个动作。对于要修改的每个动作,系统将合成一个或多个替换场景。

如图1所示,电子设备102呈现扩展现实(XR)环境108。在一个实施例中,XR环境108包括各种对象执行器,例如角色表示110a、角色表示110b、机器人表示112和无人机表示114。

在各种实施例中,对象执行器执行一个或多个动作。在一个实施例中,对象执行器执行一系列动作。在一个实施例中,电子设备102和/或控制器104确定对象执行器要执行的动作。在图1的示例中,角色表示110b正在执行施法动作;无人机表示114正在执行悬停动作。
在各种实施例中,对象执行器执行一个动作以满足一个目标。在一个实施例中,对象执行器与特定目标相关联,并且对象执行器执行提高满足特定目标可能性的操作。

在各种实施例中,对象执行器又称为动作执行代理,下称代理。在一个实施例中,代理称为虚拟代理或虚拟智能代理。

在一个实施例中,基于来自用户106的用户输入生成XR环境108。例如在一个实施例中,设备(未接收指示XR环境108的地形的用户输入。在这样的实施例中,电子设备102和/或控制器104将XR环境108配置为具有由用户输入指示的环境条件。在一个实施例中,环境条件包括温度、湿度、压力、能见度、环境光级、环境声级、一天中的时间和天气中的一个或多个。

在一个实施例中,电子设备102和/或控制器104从XR内容源118接收现有XR内容116。XR内容116可以包括由一个或多个对象执行器执行的一个或多个动作,以满足一个或多个目标。在一个实施例中,每个操作都与内容分级相关联。

可以基于由XR内容116表示的类型来选择内容分级。例如,对于表示动作电影的XR内容116,每个动作可以与根据MPAA分级系统的内容分级相关联。对于表示电视内容的XR内容116,每个动作可以与根据美国电视行业使用的内容分级系统相关联。在一个实施例中,由于不同的地理区域采用不同的内容评级系统,每个动作可根据特定地理区域的内容评级相关联。由于每个动作可以与相应的分级相关联,所以XR内容116可以包括与不同分级相关联的动作。

在一个实施例中,从现有XR内容中提取一个或多个动作。例如,电子设备102、控制器104或另一设备可以使用场景分析、场景理解、实例分割和/或语义分割的组合来提取一个或多个动作。在一个实施例中,在XR内容116中使用元数据指示一个或多个动作。例如,元数据可用于指示XR内容116的一部分表示使用枪支的战斗画面。电子设备102、控制器104或另一设备可以使用元数据提取(例如检索)一个或多个动作。

在一个实施例中,识别一个或多个要修改的操作。例如,电子设备102、控制器104或另一设备可通过确定一个或多个动作是否违反目标内容评级来识别要修改的一个或多个动作。在一个实施例中,目标内容评级是观众估计年龄的函数。例如,如果幼儿单独查看XR内容116,则目标内容分级可以是TV-Y。另一方面,如果成年人单独查看XR内容116,则目标内容分级可以是TV-MA。如果家庭正在一起查看XR内容116,则可以将目标内容评级设置为适合观众中最年轻的人员的级别,或者可以由成年人手动配置。

在一个实施例中,对于要修改的每个动作,可以通过电子设备102、控制器104和/或另一设备合成一个或多个替换动作。例如,XR内容116中的污秽语言可以替换成不那么令人反感的语言。

图2A-2B示出了在XR环境108中生成修改XR内容的示例系统200。参考图2A,在一个实施例中,紧急内容引擎202获得与XR环境108相关的XR内容项204。在一个实施例中,XR内容项目204与第一内容评级相关联。在一个实施例中,XR内容项目204中的一个或多个单独场景或动作与第一内容分级相关联。

在一个实施例中,紧急内容引擎202识别由XR内容项204中的对象执行器的XR表示执行的第一动作,例如动作206。在一些实施例中,从XR内容项204提取动作206。例如,紧急内容引擎202可以使用场景分析和/或场景理解来提取动作206。

在一个实施例中,紧急内容引擎202执行实例分割以识别执行动作206的一个或多个对象执行器,例如区分图2的角色表示110a和角色表示110b。在一个实施例中,紧急内容引擎202执行语义分割以识别执行动作206的一个或多个对象执行器,例如识别机器人表示112正在执行动作206。

紧急内容引擎202可执行场景分析、场景理解、实例分割和/或语义分割,以识别动作206中涉及的对象,例如武器。以这种方式,系统可以判断动作206的内容评级或可动作206是否违反目标内容评级。

在一个实施例中,紧急内容引擎202从XR内容项204的元数据208检索动作206。元数据208可与动作206相关联。在一个实施例中,元数据208包括关于动作206的信息。例如,元数据208可以包括指示正在执行动作206的对象执行器的参与者信息210。元数据208可包括识别动作类型的动作标识符信息212,例如使用枪支的战斗画面、带有亵渎意味的独白等。

在一个实施例中,紧急内容引擎202确定动作206是否违反目标内容评级220。例如,如果元数据208包括内容评级信息216,则紧急内容引擎202可以将内容评级信息216与目标内容评级220进行比较。

如果元数据208不包括内容分级信息216,或者如果动作206不与元数据208相关联,则紧急内容引擎202可以评估动作206,如由例如场景分析、场景理解、实例分割和/或语义分割确定,对照目标内容评级220来确定动作206是否违反目标内容评级220。

参考图2B,紧急内容引擎202可以通过多种方式中的任何一种获得目标内容评级220。在一个实施例中,例如紧急内容引擎202检测用户输入222。在一个实施例中,用户输入222包括例如家长控制设置224。家长控制设置224可以指定阈值内容分级,使得不允许显示高于阈值内容分级的内容。

在一个实施例中,在动作206违反目标内容评级220的条件下,紧急内容引擎202获得第二动作,例如替换性动作244。紧急内容引擎202可获得一个或多个潜在动作246。紧急内容引擎202可以从数据存储248检索一个或多个潜在动作246。在一个实施例中,紧急内容引擎202合成一个或多个潜在动作246。

在一个实施例中,替换动作244满足目标内容评级220。例如,紧急内容引擎202可查询数据存储248以返回具有高于目标内容评级220或低于目标内容评级220的内容评级的潜在动作246。

在一个实施例中,替换动作244在与动作206的相似程度内。例如,如果要替换的动作206是枪击,则潜在动作246的集合可以包括拳打或脚踢,但可以排除礼物交换,因为礼物交换与枪击太不相似。

在一个实施例中,紧急内容引擎202向显示引擎250提供替换动作244。显示引擎250通过用替换动作244替换动作206来修改XR内容项204,以生成修改后的XR内容项252。例如,显示引擎250修改XR内容项204的像素和/或音频数据以表示替换动作244。这样,系统200生成满足目标内容评级220的修改的XR内容项目252。

图3A是示例紧急内容引擎300的框图。在各种实施例中,紧急内容引擎300包括训练神经网络310的神经网络系统310。在各种实施例中,神经网络310生成替换动作(例如图2中所示的替换动作244),以替换违反目标内容评级(例如目标内容评级220)的动作。

在一个实施例中,神经网络310基于实例化角色表示366生成角色表示的替换动作244。例如,XR内容项可以包括角色表示366射击的动作。如果射击动作违反目标内容评级,则神经网络310可生成在角色表示366的能力范围内且满足目标内容评级的替换动作244。在一个实施例中,不同的角色表示366可以具有不同的能力,并且可以生成不同的替换动作244。例如,如果角色表示110a表示正常人,则神经网络310可以生成出拳作为替换动作244。另一方面,如果角色表示110b为超能力者,则神经网络310可以生成非致命能量攻击作为替换动作244。

相关专利Apple Patent | Modifying existing content based on target audience

名为“Modifying existing content based on target audience”的苹果专利申请最初在2021年9月提交,并在日前由美国专利商标局公布。

本文链接https://news.nweon.com/93721
转载须知:转载摘编需注明来源映维网并保留本文链接
素材版权:除额外说明,文章所用图片、视频均来自文章关联个人、企业实体等提供
QQ交流群苹果Vision  |  Meta Quest  |  微软HoloLens  |  AR/VR开发者  |  映维粉丝读者

您可能还喜欢...

资讯