Synthesis AI可通过文本提示创建逼真虚拟数字人

编辑：广东客 | 分类：快讯 | 2023年4月19日

通过文本提示创建逼真的3D数字人

（映维网Nweon 2023年04月19日）位于美国旧金山的Synthesis AI是一家专门从事合成数据技术的初创公司。团队日前宣布，他们开发了一种可以通过文本提示创建逼真虚拟数字人的新方法。

据介绍，所述技术使用生成式人工智能和视觉效果管道来制作高分辨率、电影质量的虚拟数字人，并可用于游戏、虚拟现实、电影和模拟等各种应用。

Synthesis AI声称，他们是第一家以如此高质量和细节展示文本到3D数字人的公司。其中，用户只需输入所需数字人的文本描述，如年龄、性别、种族、发型和服装，然后系统就会马上生成符合规范的3D模型。用户同时可以通过改变文本提示或使用滑块来调整面部表情和照明等功能，从而编辑3D模型。

据悉，全新的文本到虚拟数字人功能将从今年第二季度开始提供给一组选定的测试人员。

根据文本提示生成虚拟数字人

编辑3D模型

Synthesis AI首席执行官兼创始人亚沙尔·贝赫扎迪（Yashar Behzadi）表示：“我们展示的文本到3D功能以编程、API驱动的方法为起点，添加了一个非常简单的基于提示的用户界面，并输出了一个高分辨率的3D模型。”

◐ 通过生成式人工智能来实现文本到3D

Synthesis AI将生成式人工智能和电影特效管道相结合，产生完美标记的合成数据来训练机器学习模型。团队表示，这带来了高分辨率的电影质量模型，并预计能够加速AR/VR、游戏、VFX、智能城市、虚拟试穿（VTON）、汽车、工业和制造模拟等多个行业的3D应用开发，并降低相关成本。

3D模型的创建是一个复杂的过程，需要数个元素的相互作用，包括几何体、网格和纹理层。对于经验丰富的游戏和特效美术而言，从人体模型开始一直是首选。这种方法通常比从零开始构建计算机生成人类更快、更直接。

然而，制作高质量的人体模型是并不容易，需要专门的摄影测量装置捕获实际人体的多个角度，从而创建原始2D图像。然后，工作人员需要通过各种优化工具精心组合图像，以确保最佳质量。

对于文本到虚拟数字人合成，Synthesis AI设计了一种创新方法利用diffusion-based生成式人工智能架构来生成由性别、年龄、种族等关键参数控制的各种网格。其中，纹理层是使用单独的生成模型创建，以提供细粒度的独立控制，而通过合并这两个基本组件，系统可以生成一个完整的、高分辨率的3D模型。

Synthesis AI可通过文本提示创建逼真虚拟数字人