中外团队提出视频抠像后训练量化框架PTQ4VM
相比现有量化方法,PTQ4VM在不同位宽下均实现了最先进的精度性能
(映维网Nweon 2025年10月23日)视频抠像技术在影视制作和虚拟现实等应用中至关重要,然而在计算资源受限的设备部署其计算密集型模型仍存在挑战。量化作为模型压缩与加速的核心技术,其中后训练量化(PTQ)作为一种高效方法,在视频抠像领域仍处于起步阶段,并面临保持精度和时间一致性的重大难题。
为解决这些问题,南京大学,商汤科技,苏黎世联邦理工学院团队提出了一种新颖且通用的后训练量化框架PTQ4VM,专门针对视频抠像模型设计。团队的贡献包括:
-
采用两阶段量化策略:首先通过基于块重建的优化实现快速稳定的初始量化与局部依赖捕获,随后通过量化参数的全局校准最小化精度损失;
-
提出统计驱动的全局仿射校准(GAC)方法,使网络能够补偿因忽略BN层效应等因素引起的累积统计失真,甚至将现有PTQ方法在视频抠像任务中的误差降低达20%;
......(全文 2158 字,剩余 1810 字)


