ReQuant
Identifying Sensitive Weights via Post-quantization Integral阅读笔记
对于现有的敏感度指标的分析
现有的敏感度指标主要基于梯度与Hessian矩阵(使用Fisher准则估计)
- 由于模型量化后的权重可能超出收敛半径,导致泰勒展开近似失效,传统的Hessian矩阵估计也不准。
- 层与层间互相不独立,单独计算每层的权重敏感度变得不可靠。
创新点1: 后量化积分(PQI)
通过积分路径上的梯度信息,能够更准确地估计量化对损失函数的影响,即将量化损失计算改写为
其中C是从
量化损失差改写为
其中
在实际使用时,使用矩形估计的方法:
由于F的增长与
观察到较浅的层往往有较大的
创新点2:ReQuant框架
中心思想:将矩阵分解为低精度量化矩阵与高精度异常值(
自适应异常值选择
中心思想:为具有更大的
其中
分步重要权重分离
中心思想:根据
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 由本自性清净故,令诸爱染悉无垢!