Quadapter
Quadapter: Adapter for GPT-2 Quantization阅读笔记
motivation
认为激活中的outliers使得量化困难,QAT又会造成对于对于微调数据的过拟合,于是引入Quadapter保持原模型参数不变防止过拟合,并进行逐channel缩放使得激活易于量化。
创新点:Quadapter架构
对于任意两线性层间的前向传播:
其中
训练流程
阶段1:逐Quadapter块校准
对每块根据L2损失进行校准:
其中
阶段2:端到端微调
使用静态量化方法,具体流程:
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 由本自性清净故,令诸爱染悉无垢!