CART:基于分层自回归Transformer的可扩展图像生成方法

查看引用/信息源请点击:映维网Nweon

使用自回归建模的图像生成新方法

映维网Nweon 2025年04月22日)图像合成已经取得了显著的进步,并在虚拟现实等领域实现了多种应用。在一项研究中,三星研究院介绍了一种使用自回归建模的图像生成新方法,利用下一细节预测策略来增强保真度和可扩展性。

尽管自回归模型在语言建模方面取得了变革性的成功,但由于图像中固有的空间依赖性,在视觉任务中复制这一成功带来了独特的挑战。所提出的方法通过迭代地向图像构图中添加更精细的细节,将其构建为基础和细节图像因素的分层组合,而这个策略证明比传统方法更有效。

团队指出,这一方案的一个关键优点是它的可扩展性,更高的分辨率,不需要完整的模型再训练,使其成为高分辨率图像生成的通用解决方案。

生成式人工智能在图像合成和编辑方面的最新进展已经引起了业界的极大兴趣。生成式人工智能的传统方法通常旨在一次生成整个场景。然而,人类对视觉场景的感知和理解本质上是合成的。

例如在创建场景时,美术通常遵循迭代过程,从粗糙的轮廓开始,细化形状,逐渐添加细节和阴影。在一次尝试中生成整个场景会排除这种迭代添加的细节,并在缩放到高分辨率图像时提出挑战。

......(全文 1370 字,剩余 919 字)


请微信扫码通过小程序阅读完整文章
或者登入网站阅读完整文章
映维网会员可直接登入网站阅读
PICO员工可联系映维网免费获取权限

本文链接https://news.nweon.com/129294
转载须知:转载摘编需注明来源映维网并保留本文链接
素材版权:除额外说明,文章所用图片、视频均来自文章关联个人、企业实体等提供
QQ交流群苹果Vision  |  Meta Quest  |  微软HoloLens  |  AR/VR开发者  |  映维粉丝读者
资讯