首页
百科大全
文学
登录
标签
ERQ32位转5位仅掉些许精度,来看看两段式后训练量化
ERQ:32位转5位仅掉些许精度,来看看两段式后训练量化
后训练量化(PTQ)在视觉Transformer(ViTs)领域引起了广泛关注,因为它在模型压缩方面表现出了高效率。然而,现有的方法通常忽视了量化权重和激活之间复杂的相互依赖关系,导致了相当大的量化误差。论文提出了一种名为ERQ的两步PTQ
ERQ32位转5位仅掉些许精度,来看看两段式后训练量化
admin
1月前
25
0